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(57) Abstract: Tbe inventioD relates to a method for compressing 
a digital image (DB), whose image information is encoded on sev- 
eral bit planes (BE). The invention provides an ad^dve compres- 
sion method which allows the most efficient compression possible 
for digital images with any configuration. Said method comprises 
the following steps: Analysis of the bit planes (BE) of the digital 
image (DB); Sub-division of the bit planes (BE) of the digital im- 
age (DB) into several bit-plane areas, each containing at least one 
bit plane (BE); Division of the digital image (DB) into several bit- 
plane area images (BEBB), each containing one of the bit-plane ar- 
eas (block 7; block 8); Selection of a specific compression method 
for each bit-plane area image (BEBB); and Compression of the indi- 
vidual bit-plane area images (BEBB) using the respective compres- 
sion mediod which has been selected (block IS; block 16). 

(57) Zusammenfassung: Die Erfindung betrifit ein Verfahren zum 
Komprimieren eines digitalen Bildes (DB), dessen Bildinformatio- 
nen in mehreren Bitebenen (BE) codiert sind. £s wird ein adapti- 
ves Kompnmienmgsverfahren voi^eschlagen, das fiir beliebig aus- 
gestaltete digitale Bilder eine mdglichst effirienie Komprimierung 
ermoglichL £s lunf asst die nachfolgenden Scfaritte: Analysieren der 
Bitebenen (BE) des digitalen Bildes (DB); Unterteilen der Bitebe- 
nen (BE) des digitalen Bildes (DB) in mehrere Bitebenenbereiche, 
die jeweils mindestens eine Bitebene (BE) aufweisen; Aufteilen des 
digitalen BUdes (DB) in mehrere Bitebenenbereichsbilder (BEBB), 
die jeweils einen der Bitebenenbereiche lunfassen (Block 7; Block 
8); Ausw^en eines bestimmten Komprimierungsverfahrens fiir je- 
des Bitebenenbereichsbild (BEBB); und Komprimieren der einzel- 
nen Bitebenenbereichsbilder (BEBB) mit dem jeweils ausgewahlten 
Kompnmierungsverfahren (Block IS; Block 16). 



Tmt Erklarung der Zweibuchsiaben-Codes. und der anderen 
Abkiirsungen wird auf die Erkldrungen ("Guidance Notes on 
Codes and Abbreviations") am Anfangjeder regularen Ausgabe 
der PCT'Gazette verwiesen. 
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Ver£ahren zum Roxnprimieren eines digitalen Bildes mit mehreren 

Bit-Ebenen 



Die vorliegende Erfindung betrifft ein Verfahren zum 
Komprimieren eines digitalen Bildes, dessen Bildinf ormationen 
in mehreren Bitebenen codiert sind. Die Erfindung betrifft des 
Weiteren ein Verfahren zum Ubertragen eines digitalen Bildes, 
dessen Bildinf ormationen in mehreren Bitebenen codiert sind, 
von dem Endgerat eines Senders zu dem Endgerat eines 
Empf angers . 

Aus dem Stand der Technik sind ein Vielzahl unterschiedlicher 
Verfahren bekannt, urn digitale Bilder, insbesondere Fotos und 
Zeichnungen, in einer Bilddatei zu speichem, die von einem 
Computer gelesen werden kann. Alle diese bekannten Verfahren 
nutzen Komprimierungsverf ahren aus, um die Bilddatei so klein 
wie moglich zu machen^ damit sie moglichst wenig Speicherplatz 
in dem Hauptspeicher und auf Speichermedien des Computers 
benotigt. AuSerdem lassen sich digitale Bilder umso schneller 
von dem Endgerat eines Senders zu dem Endgerat eines 
Empf angers ubertragen, desto kleiner die Bilddatei ist. Als 
Endgerate werden ublicherweise Computer eingesetzt, es ist 
aber auch denkbar, mit der notwendigen Hard- und Software 
ausgestattete Telefone o. a. zu verwenden. Die Komprimierung 
digitaler Bilder ist insbesondere in der modernen 
Medizintechnik von Bedeutung, wo die Abbildungen moderner 
Computerdiagnostikgerate (z. B. Kernsp in -Tomograph, 
RSntgengerat , Computer -Tomograph, etc.) zunehmend in digitaler 
Form zum Abspeichern oder Ubertragen an andere Computer 
vorliegen . _ 



Beschreibxing 



Einige aus dem Stand der Technik bekannten Verfahren zum 
Komprimieren eines digitalen Bildes sind bspw. das Windows - 
Bit-Map (BMP) -Format , das insbesondere von kleineren, unter 
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Windows lauffahigen Graphikprogrammen verwendet wird. Das PCX- 
Format und das Windows -Metafile (WMF) -Format wird ebenf alls 
von Windows -Anwendungen, insbesondere fur Cliparts und andere 
Abbildungen verwendet- Das Tagged- Image-File-Format (TIF) - 
Verfahren wird von einer Vielzahl von Graphikprogrammen zum 
Abspeichern digitaler Bilder verwendet. Das 
Graphics -Interchange -Format (GIF) -Verfahren und das 
Joint -Photographic -Experts -Group (JPEG) - Verfahren wird 
insbesondere im Internet zum Ubertragen von digitalen Bildern 
verwendet . Diese bekannten Komprimierungsverf ahren stehen in 
der Regel in modernen Browsern, die zum Ubertragen von Dateien 
zwischen Computern eingesetzt werden, zur Verfiigung und konnen 
bei Bedarf eingesetzt werden. 

Das BMP-, WMF-, PIF-, GIF-Format wird fur die Bildbeschreibung 
angewendet. Fur die Kompression wird das Huffman-, Shannon- 
Fano-, Arithmetik-, LZW- , LZ77-, LZ78-, JPEG-, Fractal-, 
Scalar- oder Vektor-Quantisierungsverf ahren angewandt. 

Einige weniger verbreitete Formate zur Bilddarstellung eines 
digitalen Bildes umfassen das Computer-Graphics-Metafile 
(CGM) -Verfahren, das Encapsulated-Postscript (EPSI/EPSF) - 
Verfahren, das Group- 4 -Type • I (G4 CCITT) -Verfahren, das 
Portable -Bitmap (PBM) -Verfahren, das Portable -Greymap (PGM) - 
Verfahren, das Portable-Network-Graphics (PNG) -Verfahren, das 
Portable-Pixmap (PPM) -Verfahren, das Silicon-Graphics (RGB) - 
Verfahren, das Sun-Raster (SUN) -Verfahren und das Group-4- 
Type-II (TG4 CCITT) -Verfahren. Ausfiihrliche Inf ormationen zum 
Thema Komprimieren von digitalen Bildern kSnnen dem Internet 
auf der Seite http://www.cs.cmu.edu/-guyb/real-world/compress/ 
index.html (Stand 13.09.1999, zuletzt geandert am 21.07.1999) 
entnommen werden. 

Jedes dieser bekannten Verfahren zum Komprimieren eines 
digitalen Bildes erzielt bei bestimmten digitalen Bildern 
einen besonders hohen Kompressionsrate , wahrend es fur andere 
Bilder weniger gut geeignet ist. Das GIF-Verf ahren wird 
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vorzugsweise fiir Zeichnungen oder kunstlerische Abbildungen 
verwendet . Bei dem GIF-Verf ahren werden die digitalen Bilder 
uber einen Wechsel der Farb- oder Graustuf eninf ormationen und 
nicht uber die tatsachlichen Farben oder Graustufen 
komprimiert . D.h. die komprimierte Bilddatei ist umso kleiner, 
je weniger Farb- und Graustuf enwechsel das digitale Bild 
enthalt, d.h. desto groSere Flachen derselben Farbe oder 
Graustuf e es enthalt. Das GIF- Verf ahren arbeitet mit einer 8- 
bit Auflosung (Farb- oder Graustuf entiefe) pro Pixel. Aufgrund 
dieser relativ geringen Auflosung kann es, insbesondere bei 
f otograf ischen Abbildungen, bei der komprimierten Bilddatei 
dazu kommen, dass bestimmte Farben oder Graustufen 
verschwommen sind oder aus mehreren Farben oder Graustufen der 
zur Verfugung stehenden Palette aufgebaut sind, was fur einen 
Betrachter des komprimierten Bildes in einer relativ groben 
Kornung des Bildes zu erkennen ist. Da das GIF-Verf ahren die 
Inf ormationen eines digitalen Bildes uber die Wechsel der 
Farben oder Graustufen speichert, kann es beim Komprimieren 
einer f otograf ischen Abbildung mit hochauf losenden Wechseln 
der Farben oder Graustufen oder mit vielen Farben oder 
Graustufen zu einem starken Anstieg der Grofie der 
komprimierten Bilddatei kommen. Nahere Inf ormationen zu dem 
GIF-Verfahreh konnen im Internet auf der Seite 
http://www.rit.edu/-mpb9954/ mmwww/G I FComp.htm (Stand 
01.09.1999; zuletzt geandert 22.09.1997) und der Seite 
http : //www • cs - emu . edu/-guyb/real -world/compress/index . html 
(Stand 13.09.1999, zuletzt geandert am 21.07.1999) entnommen 
werden . 

Das JPEG-Verf ahren wird vorzugsweise fur f otograf ische oder 
andere hochauf losende Abbildungen verwendet. Im Gegensatz zu 
dem GIF-Verf ahren fuhrt das JPEG-Verf ahren bei einer hohen 
Feindetailierung zu einer relativ hohen Kompressionsrate . 
Allerdings arbeitet das JPEG-Verf ahren bei digitalen Bildern, 
die groSe Flachen derselben Farbe oder Graustufe enthalten 
nicht so effizient, da es zusatzliche Inf ormationen innerhalb 
und um diese Flachen herum hinzufugt, was die Abbildung 
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unsauber aussehen lasst . NShere Inf ormationen uber das JPEG- 
Verfahren kSnnen dem Internet auf der Seite 
http : //vww- rit .edu/-mpb9954/mrawvrw/JPGComp .htm (Stand 
01.09.1999, zuletzt geandert am 22.09.1997) und der Seite 
http : //www . cs . emu . edu/-guyb/real -world/compress/index . html 
(Stand 13-09.1999, zuletzt geandert am 21.07.1999) entnommen 
werden . 

Schon der Vergleich dieser beiden, aus den bekannten 
Komprimierungsverf ahren beispielhaft herausgegrif f enen 
Komprimierungsverf ahren macht deutlich, dass bestimmte 
Komprimierungsverf ahren bei bestimmten digitalen Bildern eine 
bessere Kompressionsrate erzielen konnen als bei anderen 
digitalen Bildern. Da digitale Bilder in der Regal beliebig 
ausgestaltete Bildbereiche (z. B. groSe Flachen derselben 
Farbe oder Graustufe einerseits und hochauf losende Wechsel und 
viele Farben oder Graustufen andererseits) aufweisen, stellt 
die Auswahl eines einzigen Komprimierungsverf ahrens fur ein 
digitales Bild in der Regel nur einen Kompromiss dar. 

Aus diesem Grund werden im Stand der Technik sogenannte 
adaptive Komprimierungsverf ahren eingesetzt, die die 
Bildbereiche eines digitalen Bildes auf seine Ausgestaltung 
hin analysieren und in Abhangigkeit von den Analyseergebnissen 
fur verschiedene Bereiche des Bildes unterschiedliche 
Komprimierungsverf ahren anwenden. 

Aus dem Stand der Technik sind drei verschiedene adaptive 
Komprimierungsverf ahren bekannt : 

Die erste Gruppe adaptiver Komprimierungsverf ahren beinhaltet 
lokale adaptive Algorithmen. Das digitale Bild wird zunachst 
in nicht uberlappende Bildbereiche segmentiert- Danach wird 
jeder Bereich durch ein geeignetes Komprimierungsverf ahren 
codiert, mit dem eine moglichst hohe Kompressionsrate bei 
minimalem Verlust an Inf ormationen, oder gar ohne Verlust an 
Inf ormationen, erzielt werden kann. 
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Die zweite Gruppe beinhaltet Algorithmen, die in Abhangigkeit 
von lokalen Eigenschaf ten des Bildes ihre Parameter andern, 
2.B. das Code-Buch bei der Vektor-Quantisierung oder die 
Parameter der Quantisierungsmatrix bei dem JPEG-Verf ahren oder 
bei der Huf f man-Codierung. Das digitale Bild wird dann durch 
ein Komprimierungsverf ahren mit lokal variierenden Parametern 
codiert . 

Die dritte Gruppe beinhaltet Algorithmen, die globale 
Eigenschaf ten des Bildes ermitteln und auf der Basis dieser 
globalen Eigenschaf ten das effektivste Komprimierungsverf ahren 
auswahlen. Danach wird das gesamte digitale Bild durch das 
ausgewahlte Komprimierungsverf ahren codiert. 

All diesen aus dem Stand der Technik bekannten adaptiven 
Komprimierungsverf ahren ist gemein, dass das zu komprimierende 
digitale Bild in mehrere lokale Bildbereiche segmentiert wird 
und die verschiedenen Komprimierungsverf ahren dann auf die 
einzelnen Bildbereiche angewandt werden. 

Es ist die Aufgabe der vorliegenden Erfindung, ein neuartiges 
Verfahren zum Komprimieren eines digitalen Bildes zu schaffen, 
das fiir beliebig ausgestaltete digitale Bilder eine moglichst 
effiziente Komprimierung ermoglicht, d.h. mit moglichst wenig 
Rechenaufwand eine moglichst hohe Kompressionsrate erzielen 
kann. 

Zur Losung dieser Aufgabe schlSgt die Erf indung ausgehend von 
dem Verfahren der eingangs genannten Art ein Verfahren vor, 
das gekennzeichnet ist durch die nachf olgenden Schritte: 

Analysieren der Bitebenen des digitalen Bildes; 

Unterteilen der Bitebenen des digitalen Bildes in mehrere 

Bitebenenbereiche, die jeweils mindestens eine Bitebene 

aufweisen; 

Aufteilen des digitalen Bildes in mehrere 
Bitebenenbereichsbilder die jeweils einen der 
Bitebenenbereiche umfassen; 
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Auswahlen eines bestinunten Komprimierungsverf ahrens fur 
jedes Bitebenenbereichsbild; und 

Komprimieren der einzelnen Bitebenenbereichsbilder mit 
dem jeweils ausgewahlten Komprimierungsverf ahren. 

Das zu komprimierende digitale Bild wird nicht, wie aus dem 
Stand der Technik bekannt, in mehrere Bildbereiche 
segment iert, die jeweils dieselben Bitebenen wie das digitale 
Bild aufweisen. Es werden also nicht die Inhalte des digitalen 
Bildes, sondern dessen Bitebenen analysiert. 

Die Bitebenen des digitalen Bildes werden in Abhangigkeit von 
dem Analyseergebnis in mehrere Bitebenenbereiche unterteilt. 
Das digitale Bild wird in mehrere Bitebenenbereichsbilder 
aufgeteilt, die jeweils einen der Bitebenenbereiche umfassen. 
Fur jedes Bitebenenbereichsbild wird ebenfalls in Abhangigkeit 
von dem Ergebnis der Analyse der Bitebenen des digitalen 
Bildes ein bestimmtes Komprimierungsverf ahren ausgewahlt. 

Die Bitebenen des digitalen Bildes konnen bspw. unter dem 
Gesichtspunkte einer moglichst hohen Komprimierungsrate, eines 
moglichst geringen Verlusts an Bildinhalten bei dem 
rekonstruierten Bild oder eines moglichst geringen 
Rechenauf wands analysiert werden. Die verwendeten 
Komprimierungsverf ahren werden vorzugsweise aus den in einem 
Browser ublicherweise enthaltenen herkommlichen 
Komprimierungsverf ahren ausgewahlt- SchlieiSlich werden die 
einzelnen Bitebenenbereichsbilder mit dem jeweils ausgewahlten 
Komprimierungsverf ahren komprimiert . 

Anhand der Analyse der Bitebenen des zu komprimierenden 
digitalen Bildes werden somit die Bitebenen in bestimmte 
Bitebenenbereiche unterteilt^ das digitale Bild in bestimmte 
Bitebenenbereichsbilder aufgeteilt und fiir jedes 
Bitebenenbereichsbild ein geeignetes Komprimierungsverf ahren 
ausgewahlt. Das erf indungsgemaSe Verf ahren zum Komprimieren 
eines digitalen Bildes ermoglicht eine besonders effiziente 
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Komprimierung des digitalen Bildes. Mit einem vergleichsweise 
geringen Rechenaufwand konnen be senders hohe 
Komprimierungsraten mit einem aulSerst geringen oder sogar 
keinetn Verlust an Bildinhalten erzielt werden, 

GemalS einer vorteilhaf ten Weiterbildung der vorliegenden 
Erfindung wird vorgeschlagen, dass die Bildebenen des 
digitalen Bildes in zwei Bitebenenbereiche unterteilt werden, 
das digitale Bild in zwei Bitebenenbereichsbilder aufgeteilt 
wird, fiir den ersten Bitebenenbereich, der die hoherwertigen 
Bitebenen umfasst, das GIF-Komprimierungsverf ahren und fur den 
zweiten Bitebenenbereich, der die niederwertigen Bitebenen 
umfasst, das JPEG- Komprimierungsverf ahren ausgewahlt wird, und 
die Bitebenenbereichsbilder mit dem jeweils ausgewahlten 
Komprimierungsverf ahren komprimiert werden. Das GIF- und das 
JPEG- Verf ahren sind zwei Komprimierungsverf ahren, die sich wie 
eingangs bereits erlautert besonders gut erganzen. Wo das eine 
Komprimierungsverf ahren Nachteile hat, arbeitet das andere 
Komprimierungsverf ahren besonders gut und umgekehrt. Durch den 
Einsatz dieser beiden Komprimierungsverf ahren wird eine 
besonders eff iziente Komprimierung eines digitalen Bildes 
ermoglicht. Zudem handelt es sich bei dem GIF- und dem JPEG- 
Komprimierungsverf ahren um herkSmmliche 

Komprimierungsverf ahren, die in nahezu jedem modernen Browser 
enthalten sind und dort jederzeit aufgerufen werden konnen. 

Durch die Analyse der Bitebenen des digitalen Bildes und die 
Aufteilung des digitalen Bildes in Bitebenenbereichsbilder 
wird eine besonders effiziente Aufteilung des digitalen Bildes 
in Bereiche, die mit dem GIF-Komprimiemngsverf ahren 
komprimiert werden, und in Bereiche, die mit dem JPEG- 
Komprimierungsverf ahren komprimiert werden, moglich. Eine 
solche effiziente Aufteilung des digitalen Bildes konnte durch 
eine bloSe Analyse der Bildinhalte des digitalen Bildes nicht 
erreicht werden. In den hoherwertigen Bitebenen sind 
hauptsachlich die Bildinhalte des digitalen Bildes und in den 
niederwertigen Bitebenen ist hauptsachlich das Rauschen des 
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digitalen Bildes enthalten. Die hoherwertigen Bitebenen werden 
mit dem GIF-Verf ahren und die niederwertigen Bitebenen 
einschlieSlich des Rauschens mit dem JPEG-Verf ahren 
komprimiert . 

GemaS einer bevorzugten Ausf uhrungsf orm der vorliegenden 
Erfindung wird vorgeschlagen, dass das Analysieren der 
Bitebenen des digitalen Bildes die nachf olgenden Schritte 
umf asst : 

Auf teilen des digitalen Bildes in mehrere 
Bitebenenbilder, die jeweils eine Bitebene umfassen; 
Generieren von Analysebildern durch Uberlagern mehrerer 
Bitebenenbilder, beginnend bei den Bitebenenbildern, die 
die zwei hochstwertigen Bitebenen umfassen, fur das erste 
Analysebild und durch Hinzunahme des Bitebenenbildes, das 
die jeweils nachst niedrigere Bitebene umf asst, fur jedes 
weitere Analysebild; 

Segment ieren der Analysebilder in Segmente, die jeweils 

dieselben Pixelwerte aufweisen; 

Ermitteln der Flachen der Segmente; 

Bilden des Mittelwertes der Segment flachen eines 

Analysenbildes ; 

Ermitteln des Kompressionsf aktors in Abhangigkeit von dem 
Mittelwert der Segmentf lachen beim Einsatz eines 
bestimmten Komprimierungsverf ahrens ; 
Ermitteln des Analysebildes, bei dem der 
Kompressionsf aktor beim Einsatz eines bestimmten 
Komprimierungsverf ahrens groSer als ein vorgegebener 
Grenzwertf aktor ist; und 

Bestimmen der Bitebenenbereiche in Abhangigkeit von 
denjenigen Bitebenen, die das ermittelte Analysebild 
umf asst . 

Vorteilhaf terweise wird ausgehend von dem Analysebild, das die 
Bitebenenbilder mit den hochstwertigen Bitebenen umf asst, 
dasjenige Analysebild ermittelt, bei dem der 
Kompressionsf aktor beim Einsatz eines bestimmten 
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Kotnprimierungsverf ahrens groSer als 10 ist. Dies gilt 
insbesondere fur das LZW-Verf ahren, nach dem die digit alen 
Bilder in dem GIF-Format komprimiert werden. 

Die einzelnen Analysebilder werden in Segmente segmentiert, 
die jeweils dieselben Pixelwerte, d. h. dieselben Farben oder 
Graustufen aufweisen. Falls die Flachen der Segmente eines 
Analysebildes relativ grofiflachig sind, eignet sich ein 
Komprimierungsverf ahren, das auf grofiflachige digitale Bilder 
derselben Farbe oder Graustufe ausgelegt ist, wie bspw. das 
GIF-Verf ahren, wesentlich besser zum Komprimieren dieses 
Analysebildes als ein Komprimierungsverf ahren, das auf 
hochauf losende digitale Bilder mit hoher Feindetaillierung und 
einer Vielzahl unterschiedlicher Farben und Graustufen 
ausgelegt ist, wie bspw. das JPEG-Verf ahren. 

Das Vertfahren gemaS der vorliegenden Ausfuhrungsf orm 
ermoglicht eine Aufteilung des digitalen Bildes in mehrere 
Bitebenenbereichsbilder , die genau diejenigen Bitebenen des 
digitalen Bildes umfassen, dass sie beim Einsatz eines 
geeigneten Komprimierungsverf ahrens mit einem 
Kompressionsf aktor komprimiert werden, der groSer als ein 
vorgegebener Grenzwertf aktor, vorzugsweise groSer als 10, ist. 
Da der Kompressionsf aktor bestimmter Komprimierungsverf ahren, 
bspw. des GIF -Komprimierungsverf ahrens, abhangig ist von dem 
Mittelwert der Segment flachen der Analysebilder, kann der 
Kompressionsf aktor bei der vorliegenden Ausfuhrungsf orm auf 
einfache Weise schnell und zuverlassig bestimmt werden. 
Vorzugsweise werden die Bitebenen des digitalen Bildes derart 
in Bitebenenbereiche unterteilt, dass bei Einsatz eines 
bestimmten Komprimierungsverf ahrens ein Kompressionsf aktor 
groSer 10 erzielt wird. Erzielen mehrere 

Komprimieirungsverf ahren einen Kompressionsf aktor groSer 10, so 
wird dasjenige Verf ahren ausgewahlt, das den geringsten 
Rechenaufwand oder den hochsten Kompressionsf aktor aufweist. 



GemaS einer weiteren bevorzugten Ausfuhrungsf orm der 
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vorliegenden Erfindung wird vorgeschlagen, dass vor dem 
Kompritnieren des ersten Bitebenenbereichsbildes, das die 
hoherwertigen Bitebenen umfasst, die Richtung des GIF- 
Komprimierungsverf ahrens ermittelt wird, mit der die hochste 
Kompressionsrate erzielt werden kann. Die Richtung des GIF- 
Komprimierungsverf ahrens wird vorzugsweise mit Hilfe der 
nachf olgenden Schritte ermittelt: 

Aufteilen des digitalen Bildes in mehrere 
Bitebenenbilder, die jeweils eine Bitebene umfassen; und 
Generieren von Analysebildern durch Uberlagern mehrerer 
Bitebenenbilder, beginnend bei den Bitebenenbildern, die 
die zwei hochstwertigen Bitebenen umfassen, fur das erste 
Analysebild und durch Hinzunahme des Bitebenenbildes , das 
die jeweils nachst niedrigere Bitebene umfasst, fur jedes 
weitere Analysebild ; 

Segment ieren der Analysebilder in Segmente, die jeweils 
dieselben Pixelwerte aufweisen; 
Ermitteln der vertikalen Seitenlangen und der 
horizontalen Seitenlangen der Segmente; 

Bilden des Mittelwerts der vertikalen Seitenlangen und 
der horizontalen Seitenlangen eines Analysebildes; 
Vergleich des Mittelwerts der vertikalen Seitenlangen mit 
dem Mittelwert der horizontalen Seitenlangen eines 
Analysebildes; und 

Ermitteln der Richtung des GIF-Komprimierungsverf ahrens 
aus dem Ergebnis des Vergleichs der Mittelwerte der 
Seitenlangen . 

Geraafi einer vorteilhaf ten Weiterbildung der vorliegenden 
Erfindung wird vorgeschlagen, dass das zweite 
Bitebenenbereichsbild, das die niederwertigen Bitebenen 
umfasst, vor dem Komprimieren in einen Objektbereich und in 
einen Hintergrundbereich klassif iziert wird. Der Objektbereich 
umfasst ein oder mehrere in dem digitalen Bild darzustellende 
Objekte. Der Hintergrundbereich ist unabhangig von dem oder 
jedem darzustellenden Objekt und hat keinen Einfluss auf die 
Darstellung des Objekts. Ohne Verlust an Qualitat des 
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rekonstruierten Bildes kann der Kompressionsf aktor des 
Komprimierungsverf ahrens erhoht werden, wenn der Hintergrund 
vereinfacht wird, d. h. eine geringere Auflosung und/oder 
weniger Farben oder Graustuf en auf weist . 

GemaS einer bevorzugten Ausfuhrungsf orm der vorliegenden 
Erfindung wird vorgeschlagen, dass die Klassif izierung des 
zweiten Bitebenenbereichsbildes mit Hilfe der nachf olgenden 
Schritte durchgefuhrt wird: 

Segmentieren des ersten Bitebenenbereichsbildes, das die 
hoher^^ertigen Bitebenen umfasst, in eine Vielzahl von 
Pixelblocken ; 

Segmentieren der Pixelblocke in Segmente, die jeweils 
dieselben Pixelwerte aufweisen; 

Ermitteln der Anzahl der verschiedenen Segmente mit 
unterschiedlichen Pixelwerten innerhalb eines 
Pixelblocks; 

Klassif izieren eines Pixelblocks als Objektbereich, falls 
in dem Pixelblock verschiedene Segmente enthalten sind; 
sonst Klassif izieren des Pixelblocks als 
Hintergrundbereich; und 

Klassif izieren des zweiten Bitebenenbereichsbildes, das 
die niederwertigen Bitebenen umfasst, in entsprechenden 
Objektbereich und Hintergrundbereich. 

GemaS einer anderen bevorzugten Ausfuhrungsf orm der 
vorliegenden Erfindung wird der Hintergrundbereich des zweiten 
Bitebenenbereichsbildes, das die niederwertigen Bitebenen 
umfasst, durch einen Hintergrund bestehend aus quadratischen 
Pixelblocken ersetzt, wobei alle Pixel eines Pixelblocks 
denselben Pixelwert aufweisen. Die Werte aller Pixel eines 
Pixelblocks sind vorteilhaf terweise gleich dem Mittelwert der 
Pixelwerte des Pixelblocks. Vorzugsweise wird der 
Hintergrundbereich durch einen Hintergrund bestehend aus 
Pixelblocken mit einer GroiSe von 8x8 Pixel ersetzt. Durch 
diese MaSnahmen zur Vereinfachung des Hintergrundbereichs kann 
der Kompressionsf aktor des JPEG- Komprimierungsverf ahrens 
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welter erhoht werden, ohne dass es zu einem Verlust an 
Qualitat der Bildinf ormationen des rekonstruierten Bildes 
kommt . 

Gemafi einer anderen vorteilhaf ten Weiterbildung der 
vorliegenden Erfindung wird vorgeschlagen , dass vor dem 
Komprimieren des zweiten Bitebenenbereichsbildes , das die 
niederwertigen Bitebenen umfasst, der Parameter Q fur das 
JPEG-Komprimierungsverf ahren ermittelt wird. 

Gemafi einer bevorzugten Ausf uhrungsform der vorliegenden 
Erfindung wird vorgeschlagen, dass der Parameter Q in 
Abhangigkeit von der Anzahl der Bitebenenbilder des zweiten 
Bitebenenbereichsbildes, die Bildinf ormationen enthalten 
ermittelt wird. 

Es wird des Weiteren vorgeschlagen, dass der Parameter Q 
vorteilhafterweise an Hand der nachfolgenden Schritte 
ermittelt wird: 

Aufteilen des digitalen Bildes in mehrere 
Bitebenenbilder, die jeweils eine Bitebene des digitalen 
Bildes umfassen; 

Segmentieren der Bitebenenbilder des zweiten 
Bitebenenbereichsbildes, das die niederwertigen Bitebenen 
umfasst, in Segmente, die jeweils dieselben Pixelwerte 
auf weisen; 

Ermitteln der Flachen der Segmente; 

Bilden des Mittelwerts der Segmentf ISchen eines 

Bitebenenbildes; und 

ausgehend von dem hochstwertigsten Bitebenenbild des 
zweiten Bitiebenenbereichsbildes, Ermitteln der Anzahl der 
Bitebenenbilder, bei denen die Differenz des Mittelwerts 
der Segment fiachen dieses Bitebenenbildes und des 
Mittelwerts der Segment flachen des niederwertigsten 
Bitebenenbildes groSer als 10% des Mittelwerts der 
Segmentf lachen des niederwertigsten Bitebenenbildes ist . 
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Die Abhangigkeit zwischen der ermittelten Anzahl der 
Bitebenenbilder und dem Parameter Q wird durch eine statische 
Modellierung fur jede JPEG-Version berechnet. 

GemSS einer anderen vorteilhaf ten Weiterbildung der 
vorliegenden Erfindung wird vorgeschlagen, dass die mit 
verschiedenen Komprimierungsverf ahren komprimierten 
Bitebenenbereichsbilder zu einer komprimierten Bilddatei 
zusammengef asst werden, in deren Kopfzeile Inf ormationen uber 
die GroSe der einzelnen Bitebenenbereichsbilder geschrieben 
werden. Die Kopfzeile enthalt also Inf ormationen daruber, wo 
bei der Komprimierung die Grenzen zwischen den einzelnen 
Bitbereichen gezogen wurden. 

Vorteilhaf terweise werden in die Kopfzeile der Bilddatei auch 
Inf ormationen daruber geschrieben, welches 
Bitebenenbereichsbild mit welchem Komprimierungsverf ahren 
komprimiert wurde. Anhand der in die Kopfzeile geschriebenen 
Inf ormationen kann eine komprimierte Bilddatei zu einem 
spateren Zeitpunkt problemlos wieder in die komprimierten 
Bitebenenbereichsbilder zerlegt und die einzelnen 
Bitebenenbereichsbilder mit dem entsprechenden 
Dekomprimierungsverf ahren dekomprimiert werden. 

Eine weitere Aufgabe der vorliegenden Erfindung besteht darin, 
ein Verf ahren zum Ubertragen eines digitalen Bildes der 
eingangs genannten Art zu schaffen, das bei beliebig 
ausgestalteten digitalen Bildern, d.h. bei Fotos ebenso wie 
bei Zeichnungen, eine moglichst schnelle Ubertragung des 
digitalen Bildes ermoglicht. 

Zur Losung dieser Aufgabe schlagt die Erfindung ausgehend von 
dem Verfahren zum Ubertragen eines digitalen Bildes der 
eingangs genannten Art ein Verfahren vor, das gekennzeichnet 
ist durch die nachf olgenden Schritte: 

Komprimieren des digitalen Bildes auf dem Computer des 
Senders mit Hilfe eines Verfahrens nach Anspruch 15 oder 
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16; 

Ubermitteln der kompritnierten Bilddatei von dem Endgerat 
des Senders zu dem Endgerat des Empf angers; 
Empfangen der komprimierten Bilddatei auf dem Endgerat 
des Empf angers; 

Analysieren der Kopfzeile der komprimierten Bilddatei auf 
detn Endgerat des Empf angers; 

Zerlegen der komprimierten Bilddatei in die komprimierten 
Bitebenenbereichsbilder; 

Dekomprimieren der Bitebenenbereichsbilder mit den 
entsprechenden Dekomprimierungsverf ahren auf dem Endgerat 
des Empf angers; und 

Uberlagern der dekomprimierten Bitebenenbereichsbilder zu 
dem digitalen Bild auf dem Endgerat des Empf angers. 

GemaS einer vorteilhaf ten Weiterbildung der vorliegenden 
Erfindung wird vorgeschlagen, dass mit der komprimierten 
Bilddatei auch ein auf dem Endgerat des Empfangers lauffahiges 
Sof twareprogramm ubermittelt wird, das die Analyse der 
Kopfzeile der komprimierten Bilddatei ausfuhrt, das Zerlegen 
der komprimierten Bilddatei und das Dekomprimieren der 
komprimierten Bitebenenbereichsbilder steuert und das 
Uberlagern der dekomprimierten Bitebenenbereichsbilder zu dem 
digitalen Bild ausfuhrt- 

Das Sof twareprogramm ist vorteilhaf ter Weise als ein Java- 
Applet ausgebildet, das in einem Browser des Endgerats des 
Empfangers lauf f ahig ist . 

Ein bevorzugtes Ausf lihrungsbeispiel der vorliegenden Erfindung 
wird im Folgenden anhand der Zeichnungen naher erlautert . Es 
zeigen : 

Fig. 1 ein Ablauf diagramm des erf indungsgemaSen Verf ahren 
zum Komprimieren eines digitalen Bildes gemafi einer 
bevorzugten Ausfuhrungsf orm; 
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Fig. 2 



das Aufteilen des digitalen Bildes in mehrere 
TVnalysebilder ; 



Fig. 3 



das Segmentieren der Analysebilder ; und 



Fig, 4 



das Aufteilen des digitalen Bildes in zwei 
Bitebenenbereichsbilder . 



Bei dem erf indungsgemaSen Verfahren handelt es sich urn ein 
adaptives Komprimierungsverf ahren fur digitale Bilder, deren 
Bildinf ormationen in mehreren Bitebenen codiert sind. Anders 
als bei den aus dem Stand der Technik bekannten 

Komprimierungsverf ahren werden nicht die Inhalte des digitalen 
Bildes analysiert, wird also das zu komprimierende digitale 
Bild nicht in mehrere Bildbereiche segment iert, die jeweils 
dieselben Bitebenen wie das digitale Bild aufweisen. Vielmehr 
wird das digitale Bild bei dem erf indungsgemaSen Verfahren 
anhand seiner Bitebenen analysiert, und dann werden in 
Abhangigkeit von dem Analyse ergebnis geeignete 
Komprimierungsverf ahren fur bestimmte Bitebenen ausgewahlt. 

Ein Ablaufdiagramm des erf indungsgemaSen Verfahrens ist in 
Fig. 1 dargestellt. Bei dem zu komprimierende digitalen Bild 
DB (Block 1) handelt es sich um die Aufnahme eines 
Computerdiagnostikgerats aus der Medizintechnik. Das digitale 
Bild DB weist zwolf Bitebenen BE auf , in denen die 
Bildinf ormationen codiert sind, d. h. jedes Pixel des 
digitalen Bildes DB hat 12 -bit. Die anschliefiend in einem 
Block 2 ausgefiihrten Vorgange sind zur Erlauterung in Fig. 2 
detailliert dargestellt. In Block 2 wird das digitale Bild DB 
in zwolf Bitebenenbilder BEB aufgeteilt, die jeweils eine 
Bitebene BE umfassen. Dann werden aus den Bitebenenbildern BEB 
Analysebilder AB generiert . Zum Generieren des eraten 
Analysebildes ABl werden die beiden Bitebenenbilder BEBl und 
BEB2 mit den hochstwertigen Bitebenen BEI und BE2 uberlagert. 
Pur das nachste Analysebild AB2 wird dem ersten Analysebild 
ABl das Bitebenenbild BEB3 mit der nachst niedrigeren Bitebene 
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BE3 liberlagert. Zum Generieren der ubrigen Analysebilder AB3 
bis ABll wird ebenso verfahren, so dass schliefilich aus den 
zwolf Bitebenenbilder BEB elf Analysebilder AB generiert 
werden . 

Anschliefiend werden in Block 3 die Analysebilder in Segmente 
segmentiert , die jeweils dieselben Pixelwerte, d, h. dieselbe 
Farbe oder Graustufe, aufweisen. Dieser Vorgang ist zur 
Erlauterung in Fig, 3 genauer dargestellt. In Fig. 3 ist links 
ein Analysebild AB beispeilhaft herausgegrif f en und ein 
Bereich des Analysebildes AB rechts vergrdSert dargestellt. 
Die einzelnen Segmente in diesem Bereich des Analysebildes AB 
sind mit SI bis S9 gekennzeichnet . Dann werden, noch immer in 
Block 3 / die Flachen der einzelnen Segmente ermittelt . Das 
Segment SI hat bspw. eine Flache von 7 und das Segment S8 eine 
Flache von 34. SchlieSlich werden die Mittelwerte der 
Segment flachen eines jeden Analysebildes AB gebildet. 

Zwischen dem Mittelwert der Segmentf lachen und dem 
Kompressionsf aktor des GIF-Komprimierungsverf ahrens besteht 
eine Abhangigkeit . Aufgrund dieser Abhangigkeit wird in den 
Blocken 4 bis 6 beginnend bei der hochstwertigsten Bitebene 
die Anzahl n der Bitebenen BE berechnet, bei denen die 
Bedingung, dass der Kompressionsf aktor bei der Kompression 
eines Analysebildes AB rait einem bestimraten Kompressionsf aktor 
groSer als 10 ist, noch richtig ist. 

Die Blocke 4 bis 6 lief em einen Grenzwert, an dem die 
Bitebenen BE des digitalen Bildes DB in einen niederivertigen 
Bitebenenbereich und in einen hoherwert.igen Bitebenenbereich 
imterteilt werden. Das digitals Bild DB wird dann in ein 
erstes Bitebenenbereichsbild BEBBl, das den Bitebenenbereich 
mit den hoherwertigen Bitebenen BEI bis BE4 umfasst, (Block 7) 
und in ein zweites Bitebenenbereichsbild BEBB2, das den 
Bitebenenbereich mit den niederwertigen Bitebenen BEB bis BE12 
umfasst, aufgeteilt (Block 8) . Das erste Bitebenenbereichsbild 
BEBBl entspricht dem Analysebild A3, das die Bitebenenbilder 
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BEBl bis BEB4 mit den entsprechenden Bitebenen BEl bis BE4 
umfasst. Das zweite Bitebenenbereichsbild BEBB2 entspricht der 
Differenz des digitalen Bildes DB und dem ersten 
Bitebenenbereichsbild BEBBl . Die Auf teilung des digitalen 
Bildes DB in das erste und das zweite Bitebenenbereichsbild 
BEBBl bzw. BEBB2 ist in Fig. 4 verdeutlicht . Fur das erste 
Bitebenenbereichsbild BEBBl wird das GIF- 
Komprimierungsverf ahren ausgewahlt und fur das zweite 
Bitebenenbereichsbild BEBB2 das JPEG- Komprimierungsverf ahren. 

In Block 9 wird die Richtung des GIF-Komprimierungsverf ahrens 
ermittelt, mit der die hochste Kompressionsrate erzielt werden 
kann. Dazu werden die vertikalen Seitenlangen und die 
horizontalen Seitenlangen der Segmente der Analysebilder AB 
ermittelt (vgl. Fig. 3) . Das Segment SI hat bspw. eine 
vertikale Seitenlange {H6he) von 2 und eine horizontale 
Seitenlange (Breite) von 4 und das Segment S8 eine Hohe von 4 
und eine Breite von 12 . Dann wird der Mittelwert der 
vertikalen Seitenlangen und der horizontalen Seitenlangen 
eines jeden Analysebildes AB gebildet - Aus einem Vergleich des 
Mittelwerts der vertikalen Seitenlangen rait dem Mittelwert der 
horizontalen Seitenlangen eines jeden Analysebildes RB wird 
schlielSlich die Richtung des GIF-Komprimierungsverf ahrens 
gebildet . 

In den Blocken 10 bis 12 wird die Anzahl k der Bitebenen BE 
des zweiten Bitebenenbereichsbildes BEBB2 ermittelt, die 
Bildinf ormationen enthalten. Es wird davon ausgegangen, dass 
eine Bitebene BE dann Bildinf ormationen enthalt, wenn das 
Verhaltnis Peak-Signal- to-Noise-Ratio (PSNR) groSer als 40 dB 
ist, d. h. wenn die Differenz zwischen dem Mittelwert der 
Segmentf lachen dieses Bitebenenbildes BEB und dem Mittelwert 
der Segmentf lache des niederwertigsten Bitebenenbildes BEB12 
kleiner als 10% des Mittelwerts der Segmentf lachen des 
niederwertigsten Bitebenenbildes BEB12 ist. Ausgehend von der 
hochstwertigen Bitebene des zweiten Bitebenenbereichsbildes 
wird dies in dem Block 11 uberpruft. 
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In Block 13 wird der Parameter Q fiir das JPEG-Verf ahren 
ermittelt. Der Parameter Q wird in Abhangigkeit von der Anzahl 
k der Bitebenen BE5 bis BE12 des zweiten 

Bitebenenbereichsbildes BEBB2 ermittelt, die Bildinf ormationen 
enthalten. 

AnschlieSend wird das zweite Bitebenenbereichsbild BEBB2 in 
Block 14 in einen Objektbereich und in einen 
Hintergrundbereich klassif iziert . Dazu wird das erste 
Bitebenenbereichsbild BEBBl in eine Vielzahl von Pixelblocken 
segmentiert. Die Pixelblocke werden ihrerseits in Segmente, 
die jeweils dieselben Pixelwerte aufweisen, segmentiert. Dann 
wird die Anzahl der verschiedenen Segmente mit 
unterschiedlichen Pixelwerten innerhalb jeweils eines 
Pixelblocks ermittelt. Ein Pixelblock wird als Objektbereich 
klassif iziert , falls in dem Pixelblock verschiedene Segmente 
mit zwei oder mehr unterschiedlichen Pixelwerten enthalten 
sind- Sonst wird der Pixelblock als Hintergrundbereich 
klassif iziert . Das zweite Bitebenenbereichsbild BEBB2 wird 
dann in einen entsprechenden Objektbereich und 
Hintergrundbereich klassif iziert . 

Zur Erhohung der Kompressionsrate wird der Hintergrundbereich 
durch einen Hintergrund bestehend aus quadratischen 
Pixelblocken mit einer GroSe von 8x8 Pixel ersetzt . Alle Pixel 
eines Pixelblocks weisen denselben Pixelwert auf / namlich den 
Mittelwert der Pixelwerte des Pixelblocks. 

In Block 15 wird das erste Bitebenenbereichsbild BEBBl in der 
in Block 9 ennittelten Richtung mit dem GIF- 

Komprimierungsverf ahren komprimiert. Ebenso wird in Block 16 
das zweite Bitebenenbereichsbild BEBB2 mit dem in Block 13 
ermittelten Parameter Q und dem in Block 14 vereinf achten 
Hintergrundbereich mit dem JPEG -Komprimierungsverf ahren 
komprimiert. Die komprimierten Bitebenenbereichsbilder werden 
in Block 17 zu einer komprimierten Bilddatei (Block 18} 
zusammengef aSt . In einer Kopf zeile der komprimierten Bilddatei 
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werden Inf ormationen uber die GroSe der einzelnen 
Bitebenenbereichsbilder und uber die auf die einzelnen 
Bitebenenbereichsbilder BEBB angewandten 
Komprimierungsverf ahren geschrieben . 
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Paten tanspruche 



Verf ahren zum Komprimieren eines digitalen Bildes (DB) , 
dessen Bildinf oarmationen in mehreren Bitebenen (BE) 
codiert sind, gekennzeichnet durch die nachf olgenden 
Schritte: 

Analysieren der Bitebenen (BE) des digitalen Bildes 
(DB) ; 

Unterteilen der Bitebenen (BE) des digitalen Bildes 
(DB) in mehrere Bitebenenbereiche, die jeweils 
mindestens eine Bitebene (BE) aufweiseri; 
Aufteilen des digitalen Bildes (DB) in mehrere 
Bitebenenbereichsbilder (BEBB) , die jeweils einen 
der Bitebenenbereiche umfassen; 

Auswahlen eines bestimmten Komprimierungsverf ahrens 
fur jedes Bitebenenbereichsbild (BEBB) ; und 
Komprimieren der einzelnen Bitebenenbereichsbilder 
(BEBB) mit dem jeweils ausgewahlten 
Komprimierungsverf ahren . 

Verf ahren nach Anspruch 1, dadurch gekennzeichnet , dass 
die Bildebenen (BE) des digitalen Bildes (DB) in zwei 
Bitebenenbereiche unterteilt werden, das digit ale Bild in 
zwei Bitebenenbereichsbilder (BEBBl; BEBB2) aufgeteilt 
wird, fur den ersten Bitebenenbereich, der die 
hoherwertigen Bitebenen (BE) umfasst, das GIF- 
Komprimierungsverf ahren und fur den zweiten 
Bitebenenbereich, der die niederwertigen Bitebenen (BE) 
umfasst/ das JPEG- Komprimierungsverf ahren ausgewahlt 
wird, und die Bitebenenbereichsbilder (BEBBl; BEBB2) mit 
dem jeweils ausgewahlten Komprimierungsverf ahren 
komprimiert werden. 

Verf ahren nach Anspruch 1 oder 2, dadurch gekennzeichnet , 
dass das Analysieren der Bitebenen (BE) des digitalen 
Bildes (DB) die nachf olgenden Schritte umfasst: 
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Aufteilen des digitalen Bildes (DB) in mehrere 
Bitebenenbilder (BEB) , die jeweils eine Bitebene 
(BE) umfassen; 

Generieren von Analysebildern (AB) durch Uberlagern 
mehrerer Bitebenenbilder (BEB) , beginnend bei den 
Bitebenenbildern (BEBl, BEB2) , die die zwei 
hochstwertigen Bitebenen (BE) umfassen, fur das 
erste Analysebild (ABl) und durch Hinzunahme des 
Bitebenenbildes (BEB3 . . .BEB12) , das die jeweils 
nachst niedrigere Bitebene (BE3,..BE12) umfasst, fur 
jedes weitere Analysebild (AB2 . . .ABll) ; 
Segmentieren der Analysebilder (AB) in Segmente (S) , 
die jeweils dieselben Pixelwerte aufweisen; 
Ermitteln der Flachen der Segmente (S) ; 
Bilden des Mittelwertes der Segment flachen eines 
Analysenbildes (AB) ; 

Ermitteln des Kompressionsf aktors in Abhangigkeit 
von dem Mittelwert der Segment flachen beim Einsatz 
eines bestimmten Komprimierungsverf ahrens ; 
Ermitteln des Analysebildes (AB) , bei dem der 
Kompressionsfaktor beim Einsatz eines bestimmten 
Komprimierungsverf ahrens groSer als ein vorgegebener 
Grenzwertf aktor ist; und 

Bestimmen der Bitebenenbereiche in Abhangigkeit von 
denjenigen Bitebenen (BE) , die das ermittelte 
Analysebild (AB) umf asst . 

Verfahren nach Anspruch 3, dadurch gekennzeichnet , dass 
ausgehend von dem Analysebild (ABl), das die 
Bitebenenbilder (BEB) mit den hochstwertigen Bitebenen 
(BE) umf asst, das Analysebild (AB) ermittelt wird, bei 
dem der Kompressionsfaktor beim Einsatz eines bestimmten 
Komprimierungsverf ahrens groSer als 10 ist* 

Verfahren nach Anspruch 2, dadurch gekennzeichnet , dass 
vor dem Komprimieren des ersten Bitebenenbereichsbildes 
(BEBBl) , das die hoherwertigen Bitebenen (BE) umfasst, 
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die Richtung des GIF-Komprimierungsverf ahrens ermittelt 
wird/ mit der die hochste Kompressionsrate erzielt werden 
kann. 

Verfahren nach Anspruch 5, dadurch gekennzeichnet , dass 
die Richtung des GIF-Komprimierungsverf ahrens mit Hilfe 
der . nachf olgenden Schritte ermittelt wird: 

Aufteilen des digitalen Bildes (DB) in mehrere 
Bitebenenbilder (BEE) , die jeweils eine Bitebene 
(BE) umfassen; 

Generieren von Analysebildern (AB) durch Uberlagern 
mehrerer Bitebenenbilder (BEB) , beginnend bei den 
Bitebenenbildern (BEBl, BEB2) , die die zwei 
hochstwertigen Bitebenen (BEI, BE2) umfassen, fur 
das erste Analysebild (ABl) und durch Hinzunahme des 
Bitebenenbildes (BEB3 . • . BEB12 ) , das die jeweils 
nachst niedrigere Bitebene {BE3...BE12) umfasst, fur 
jedes weitere Analysebild (AB2 . • .ABll) ; 
Segmentieren der Analysebilder (AB) in Segmente (S) , 
die jeweils dieselben Pixelwerte aufweisen; 
Ermitteln der vertikalen Seitenlangen und der 
horizontalen Seitenlangen der Segmente (S) ; 
Bilden des Mittelwerts der vertikalen Seitenlangen 
und der horizontalen Seitenlangen eines 
Analysebildes (AB) ; 

Vergleich des Mittelwerts der vertikalen 
Seitenlangen mit dem Mittelwert der horizontalen 
Seitenlangen eines jeden Analysebildes (AB) ; und 
Ermitteln der Richtung des GIF- 
Komprimierungsverf ahrens aus dem Ergebnis des 
Vergleichs der 'Mittelwerte der Seitenlangen. 

Verfahren nach Anspruch 2, dadurch gekennzeichnet , dass 
das zweite Bitebenenbereichsbild (BEBB2) , das die 
niederwertigen Bitebenen (BE) umfasst, vor dem 
Komprimieren in einen Objektbereich und in einen 
Hintergrundbereich klassif iziert wird. 



wo 01/20897 



# 



PCT/EPOO/08543 



23 . ^ 

8. Verfahren nach Anspruch 7, dadurch gekennzeichnet , dass 
die Klassif izierung des zweiten Bitebenenbereichsbildes 
(BEBB2) mit Hilfe der nachf olgenden Schritte durchgefuhrt 
wird: 



Segmentieren des ersten Bitebenenbereichsbildes, das 
die hoherwertigen Bitebenen umfasst, in eine 
Vielzahl von Pixelblocken; 

Segmentieren der Pixelblocke in Segmente, die 
jeweils dieselben Pixelwerte aufweisen; 
Ermitteln der Anzahl der verschiedenen Segmente mit 
unterschiedlichen Pixelwerten innerhalb eines 
Pixelblocks ; 

Klassif izieren eines Pixelblocks als Objektbereich, 
falls in dem Pixelblock verschiedene Segmente 
enthalten sind; 

sonst Klassif izieren des Pixelblocks als 
Hintergrundbereich; und 

Klassif izieren des zweiten Bitebenenbereichsbildes 
(BEBB2) , das die niederwertigen Bitebenen (BE) 
umfasst, in entsprechenden Objektbereich und 
Hintergrundbereich . 



9. Verfahren nach Anspruch 7 oder 8, dadurch gekennzeichnet , 
dass der Hintergrundbereich des zweiten 

Bitebenenbereichsbildes (BEBB2) , das die niederwertigen 
Bitebenen (BE) umfasst, durch einen Hintergrund bestehend 
aus quadratischen Pixelblocken ersetzt wird, wobei alle 
Pixel eines Pixelblocks denselben Pixelwert aufweisen. 

10. Verfahren nach Anspruch 9, dadurch gekennzeichnet , dass 
die Pixelwerte aller Pixel eines Pixelblocks gleich dem 
Mittelwert der Pixelwerte des Pixelblocks sind. 

11. Verfahren nach Anspruch 9 oder 10, dadurch 
gekennzeichnet , dass der Hintergrundbereich durch einen 
Hintergrund bestehend aus Pixelblocken mit einer GroSe 
von 8x8 Pixel ersetzt wird. 
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12. Verfahren nach Anspruch 2, dadurch gekennzeichnet , dass 
vor dem Komprimieren des zweiten Bitebenenbereichsbildes 
(BEBB2) , das die niederwertigen Bitebenen (BE) umfasst, 
der Parameter Q fur das JPEG-Komprimierungsverf ahren 
ertnittelt wird. 

13. Verfahren nach Anspruch 12, dadurch gekennzeichnet , dass 
der Parameter Q in Abhangigkeit von der Anzahl der 
Bitebenenbilder (BEB) des zweiten Bitebenenbereichsbildes 
(BEBB2) , die Bildinformationen enthalten, ermittelt wird, 

14. Verfahren nach Anspruch 13, dadurch gekennzeichnet , dass 
der Parameter Q an Hand der nachf olgenden Schritte 
ermittelt wird: 

Aufteilen des digitalen Bildes (DB) in mehrere 
Bitebenenbilder (BEB) , die jeweils eine Bitebene 

(BE) des digitalen Bildes (DB) umf assent- 
Segment ieren der Bitebenenbilder (BEB) des zweiten 
Bitebenenbereichsbildes (BEBB) , das die 
niederwertigen Bitebenen umfasst, in Segmente (S) , 
die jeweils dieselben Pixelwerte aufweisen; 
Ermitteln der Flachen der Segmente (S) ; 
Bilden des Mittelwerts der Segmentf lachen eines 
Bitebenenbildes (BEB) des Bitebenenbereichsbildes 

(BEBB2) ; und 

ausgehend von dem hochstwertigen Bitebenenbild (BEB) 
des zweiten Bitebenenbereichsbildes (BEBB2) , 
Ermitteln der Anzahl der Bitebenenbilder (BEB) , bei 
denen die Dif ferenz aus dem Mittelwert der 
Segmentf ISchen dieses Bitebenenbildes (BEB) und dem 
Mittelwert der Segmentf lachen des niederwertigsten 
Bitebenenbildes (BEB12) groSer als 10% des 
Mittelwerts der Segmentf lachen des niederwertigsten 
Bitebenenbildes (BBB12) ist. 



15. Verfahren nach einem der Anspriiche 1 bis 14, dadurch 
gekennzeichnet, dass die mit verschiedenen 
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Komprimierungsverf ahren komprimierten 

Bitebenenbereichsbilder (BEBB) zu einer komprimierten 
Bilddatei zusammengef asst werden, in deren Kopfzeile 
Inf ormationen uber die GroSe der einzelnen 
Bitebenenbereichsbilder (BEBB) geschrieben werden. 

Verf ahren nach Anspruch 15, dadurch gekennzeichnet , dass 
in die Kopfzeile der komprimierten Bilddatei 
Inf ormationen daruber geschrieben werden, welches 
Bitebenenbereichsbild (BEBB) mit welchem 
Komprimierungsverf ahren komprimiert wurde, 

Verf ahren zum Ubertragen eines digitalen Bildes (DB) , 
dessen Bildinf ormationen in mehreren Bitebenen (BE) 
codiert sind, von dem Endgerat eines Senders zu dem 
Endgerat eines Empf angers, gekezmzeichnet durch die 
nachf olgenden Schritte : 

Komprimieren des digitalen Bildes (DB) auf dem 
Endgerat des Senders mit Hilfe eines Verfahrens nach 
Anspruch 15 oder 16 ; 

Ubermitteln der komprimierten Bilddatei von dem 
Endgerat des Senders zu dem Endgerat des Empf angers; 
Empfangen der komprimierten Bilddatei auf dem 
Endgerat des Empf angers; 

Analysieren der Kopfzeile der komprimierten 
Bilddatei auf dem Endgerat des Empf angers; 
Zerlegen der komprimierten Bilddatei in die 
komprimierten Bitebenenbereichsbilder; 
Dekomprimieren der Bitebenenbereichsbilder mit den 
entsprechenden Dekomprimierungsverf ahren auf dem 
Endgerat des Empf angers; und 
Uberlagern der dekomprimierten 

Bitebenenbereichsbilder (BEBB) zu dem digitalen Bild 
(DB) auf dem Endgerat des Empf angers. 

Verf ahren nach Anspruch 17, dadurch gekennzeichnet , dass 
mit der komprimierten Bilddatei auch ein auf dem Endgerat 
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des Empfangers lauffahiges Sof twareprogramm ubermittelt 
wird, das die Analyse der Kopfzeile der komprimierten 
Bilddatei ausfuhrt, das Zerlegen der komprimierten 
Bilddatei und das Dekompriraieren der komprimierten 
Bitebenenbereichsbilder steuert vmd das Uberlagern der 
dekomprimierten Bitebenenbereichsbilder zu dem digitalen 
Bild ausfuhrt. 

Verfahren nach Anspruch 18, dadurch gekennzeichnet , dass 
das Sof twareprogramm als ein Java-Applet ausgebildet ist, 
das in einem Browser des EndgerSts des Empfangers 
lauffahig ist. 
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CONTEXT-BASED, ADAPTIVE, LOSSLESS IMAGE CODEC 

CLAIM OF PRIORITY 
The present application claims partial priority of 
British Provisional Patent Application Serial No. 9422738-6 
filed 10 November 1994. 



BACKGROUND OF THE INVENTION 
With rapidly-advancing computer, telecommunication, 
and digital imaging technologies, there is an astronomical 
amount of image data for a wide range of applications such as 
15 education, entertainment, medical imaging, space exploration, 
electronic publishing, visual arts, etc- This rapid growth of 
image data puts punishing burdens on computer storage and 
visual communication bandwidth- Thus image compression 
becomes a pressing technical challenge in visual 
20 communications and computing, without which it will be 

difficult to build, deploy, and use cost-effective multimedia 
information systems. 

Lossless compression is a form of compression where 
an image can be reconstructed without any loss of information. 
25 Lossless image compression is required by medical imaging, 
satellite/ aerial imaging, image archiving, preservation of 
precious art work and documents, the press, or any 
applications demanding ultra high image fidelity - 
Furthermore, lossless image coding is the necessary last step 
30 of many lossy image compression systems, such as lossless 

compression of codeword indices in vector quantization (VQ) , 
and lossless compression of transform coefficients in Discrete 
Cosine Transform (DCT) and wavelet/ subband-based coding. 

There exists a large body of literature on lossless 
35 image compression algorithms and systems, such as the IBM 

Q-coder, and JPEG lossless coder. Among notable patents and 
publications are the US patents and research publications 
listed below: 

SUBSTITUTE SHEET (RULE 26) 
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4,463,342 1984 IBM. 
4,749,983 07/1988 Langdon. 
4,969,204 11/1989 Melnychuck et al. 
5,050,230 09/1990 Jones et al. 

Universal Modeling and Coding ~ J. Rissanen and G. Langdon, 
1981, IEEE, vol. IT-27. 

A Universal Data Compression System — j. Rissanen, 1983, 
IEEE, vol. IT-29. 

Parameter Reduction and Context Selection for Compression of 
the Gray-scale Images — s. Todd, g. Langdon, and J. Rissanen, 
1985, IBM J. Res. & Develop., vol. 29. 
Comparing the Lossless Image Compression Standards and 
universal Context Modelling ~ r. Arps, M. Weinberger, T. 
Truong, and J. Rissanen, Proc. of the Picture Coding 
15 Symposium, Sacramento, September 1994. 

on the JPEG Model for Lossless Image Compression — 
G. Langdon, A. Gulati, and E. Seller, 
Proc. of 1992 Data Compression Conf. 

New Methods for lossless image Compression Using Arithmetic 
coding —P. Howard and J. Vitter, 1992, Info. Proc. & Manag. , 
vol. 28. 

The currently achievable lossless compression ratio 
is still modest, being typically from 1.5:1 to 2.5:1. For 
instance, in contrast to the success of jpeg's lossy 
25 compression standard, the current JPEG's lossless compression 
standard has sufficiently poor coding efficiency that it is 
seldom used in practice. 

In 1994, ISO and JPEG solicited for proposals for 
the next international standard for lossless image 
30 compression. The present invention is a result of the 
inventors' response to the iso solicitation. The lead 
inventor Xiaolin Wu, developed a context-based, adaptive, 
lossless image coding and decoding technique (herein CALIC) . 
Among nine proposals that were submitted to ISO for its 
35 initial evaluation as candidates for the lossless image 

compression standard in 1995, the present CALIC system ranked 
first according to a criterion that accounts for both coding 
efficiency and algorithm simplicity. 



20 
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Known prior art on lossless compression of 
continuous-tone images is based on the principle of predictive 
coding. An image is traversed, and pixels are encoded in a 
fixed order, typically in raster scan sequence. Previously 
5 encoded pixels that are known to both the encoder and the 
decoder are used to predict the upcoming pixels. The 
prediction errors rather than the pixels themselves are 
entropy encoded by Huffman or like arithmetic coding. The 
original image is reconstructed by adding the error term back 

10 to the prediction value. The predictive coding works because 
the histogram of the errors is much more concentrated (heavily 
biased toward 0) than the histogram of the pixel values, 
resulting in a significantly smaller zero-order entropy for 
the former than for the latter. Among numerous prediction 

15 schemes in the literature, the simplest type is a fixed linear 
predictor such as those used under the current lossless JPEG 
standard. 

A linear predictor can be optimized on an 
image-by-image or even block-by-block basis via linear 

20 regression. However, such an optimization is expensive and 

brings only modest improvement in coding efficiency. Moreover 
the performance of linear predictors is not robust in the 
areas of edges. Adaptive, non-linear predictor- can adjust 
parameters according to the local edge strengths and 

25 orientations, if edges exist. The adjustment of predictor 
parameters can be made very efficient since it is based on 

local information. 

Historically, lossless image compression inherited 
the theoretical framework and methodology of text compression. 
30 Statistical modeling of the source being compressed plays a 

central role in any data compression systems. Suppose that we 
encode a finite source Xi,X2,..,x„ sequentially. The optimal 
code length of the sequence in bits is then 



35 given the assignments of conditional probabilities. 

Arithmetic coding can approach this code length of the source, 
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The challenge is to assign the conditional probabilities 
Pf'^{i+l> I '^i'- '^i) "to maximize the product given above, hence 
minimize the code length. The achievable compression is 
governed by a scheme, or a model, that can assign high 
conditional probability distributions PCx^i^^j |Xi,..,Xi) to the 
given sequence. 

Fitting a given source well with statistical models 
is a difficult and computationally very expensive task. 
Context modeling of continuous-tone images is made even more 
difficult by the large alphabet size 256) of grey-scale 
images. Context modeling of the source symbols (pixel values) 
would lead to an unwieldily large number of possible model 
states (contexts). This is more than a problem of high time 
and space complexities for modeling, if the number of model 
parameters is too large with respect to the image resolution, 
there will be insufficient samples to obtain good estimates of 
conditional probabilities on the model states, leading to poor 
coding efficiency. This is known as a "context dilution 
problem." This problem was theoretically formulated by 
Rissanen in the framework of stochastic complexity as the 
"model cost." Rissanen 's work proves that the high complexity 
of a model can reduce coding efficiency, as observed by many 
data compression practitioners. What is needed are innovative 
algorithmic techniques to reduce the model complexity for 
improving both coding and computational efficiency. 

SUMMARY OF THE INVENTION 
According to the invention, an encoding/ decoding 
method is provided for lossless (reversible) compression of 
digital pictures of all types, including continuous-tone 
images, graphics, multimedia images of mixed text, graphics 
and photographs, binary documents and drawings. Continuous- 
tone mode and binary mode are identified on a pixel -by-pixel 
basis. In continous-tone mode, context modeling and 
prediction are employed, involving mostly integer arithmetic 
and simple logic in a conceptually sophisticated scheme. Both 
the encoding and decoding techniques are suitable for 
sequential and progressive transmission, although different 
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specific algorithms may be employed for the different specific 
cases. The system is symmetric, meaning that the encoder and 
decoder have the same time and space complexities. 

A primary reason for the improved coding efficiency 
5 by context modeling of errors and error feedback lies in the 
fact that the prediction error sequence is a composition of 
multiple sources of distinct underlying statistics. The use 
of proper contexts to separate the statistically distinct 
sources of errors from the code stream can get a significant 
10 reduction in conditional entropies. 

The invention will be better understood by reference 
to the following detailed description in connection with the 
accompanying drawings. 



3^5 BRIEF DESCRIPTION OF THE DRAWINGS 

Fig. 1 is a schematic description of an encoding 
process for compression according to the invention in which 
the decoding process is a reverse. 

Fig. 2 illustrates labeling of neighboring pixels 
20 for context-based prediction and modeling. 

Fig. 3 shows four possible convexity relationships 
between a GAP predictor i and two neighboring pixels. 

Fig. 4 illustrates a two-stage adaptive prediction 
scheme via context modeling of prediction errors and error 
5 feedback. 

Fig* 5 is a chart depicting a method for determining 
a possible hierarchy of contexts (causal templates around a 
coded pixel marked by '?•) in which optimal modeling context 
is selected. 

0 Fig. 6 is a two-part graph illustrating a sign 

flipping technique to sharpen conditional error probability 
density functions for entropy reduction without increasing 

modeling space. 

Fig. 7 is the block diagram of a four-pass encoding 
15 scheme for progressive transmission according to the 
invention. 
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Fig. 8 is a diagram and key illustrating interlaced 
sampling for the first pass and the configuration of 
prediction and modeling context for such a pass. 

Fig. 9 is a diagram and key illustrating interlaced 
5 sampling for the second pass and the configuration of 
prediction and modeling context for such a pass* 

Fig. 10 is a diagram and key illustrating 
functionally lossless reconstruction at the third pass and the 
configuration of prediction and modeling context used in this 
10 pass. 

DESCRIPTION OF SPECIFIC EMBODIMENTS 
Basic Compression System 

Referring to Fig. l, before actual compression, a 

15 system 10 operating according to the invention includes a 

decision maker 12 which dynamically selects on parts of the 
image between a compression scheme for continuous-tone image 
data and a compression scheme for binary image data based on 
context of the pixel data. In binary mode, the image data is 

20 compressed by a first encoder 14 using context-based, 

adaptive, ternary entropy encoding. In the continuous-tone 
mode, the image data is compressed by a second encoder 16 
using context-based, adaptive, non- linear predictive coding. 
Before encoding or decoding an image, the system is designed 

25 to provide or selects between sequential transmission and 

progressive transmission, to encode or decode image data by 
the appropriated types of context-sensitive entropy-encoding 
and decoding processors. Image data encoded and decoded in 
raster scan order in a single pass through the image is 

30 preferably transmitted by sequential transmission. The coding 
process uses prediction contexts that involve only the 
previous two or three scan lines of coded pixels. 
Consequently, the encoding and decoding processes require only 
a simple double buffer 18 that holds only the two or three 

35 rows of pixels that immediately precede the current pixel. 
(Where greater buffer space is available, the system can 
achieve progressive transmission via interlaced subsampling 
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that encodes, and accordingly decodes, an image in four 
passes. ) 

In coding a picture, the CALIC system dynamically 
operates in two modes: binary and continuous-tone modes. The 
5 binary mode is for the situation in which the current locality 
of interest in the input image has no more than two distinct 
intensity values; hence it is designed for a more general 
class of images or subimages than the class of black-and-white 
images . 

j^O An innovation of the system is to distinguish 

between binary and continuous-tone types of pictures on a 
local, rather than a global, basis. The system automatically 
selects one of the two modes depending on the context of the 
current pixel. In the binary mode, the context-based adaptive 

15 entropy coder 14 is used to code three symbols, including an 
escape symbol. This distinction between binary and 
continuous-tone modes is important because the coding 
methodologies are very different in the two modes, and it 
contributes to the universality and robustness of the CALIC 

20 system over a wide range of pictures, including those that mix 
texts, graphics and photographs in multimedia applications. 

The selection between the continuous-tone and binary 
modes is based on pixel context. The mode selection is 
automatic and completely transparent to the user. No side 

25 information about mode switching is required. The coded image 
only needs a header of five bytes: two for width, two for 
height, and one for depth or the number of bits in intensity 
resolution. 

In the continuous -tone mode, a mechanism 20 is 
30 provided to compress pixel values by context-based, adaptive, 
predictive coding. To predict the current pixel value, a 
predictor 22 is provided for a local intensity gradient to be 
estimated based on the neighboring pixels in horizontal and 
vertical directions. These estimates are used to detect the 
3 5 magnitude and orientation of edges in the input image so that 
adjustments can be made to the prediction accordingly. This 
gradient-adjusted prediction (GAP), denoted by i, of J is 
further corrected based on the particular pattern that the 
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neighboring pixels exhibit (as shown here as an output: of an 
error modeling function 26) . This is necessary because 
gradients alone cannot adec[uately characterize some of the 
more complex relationships between the predicted pixel and its 
surroundings • Context modeling can exploit higher-order 
structures such as texture patterns in the image. This is 
done by quantizing the neighborhood into different 
conditioning classes, and estimating the expectation of the 
GAP prediction error e = J - jf in each of these classes 
separately. The reasons for estimating conditional 
expectations rather than the conditional density functions, as 
commonly suggested in the literature, are to prevent the 
problem of context dilution (sample counts are insufficient to 
obtain good estimates) , and to reduce time and space 
complexities. The conditional error expectation estimate is 
then fed back to the GAP predictor 22 / to generate a second 
and improved prediction denoted by J, which is equal to ^ + e. 
The net effect is a context-based, adaptive, non-linear 
predictor that can correct itself by learning from its 
mistakes made in the past and in the same context. This is a 
key feature to distinguish the prediction scheme of the CALIC 
system from the existing prediction schemes. 

The final prediction error c « J - x is entropy 
encoded. In driving the entropy coder 16, a modest number 
(between 8 and 32) of conditional probabilities of prediction 
errors e are estimated (by an estimator 24) depending on an 
estimate of the prediction error energy. The error energy 
estimator is a linear function of the horizontal and vertical 
gradient and of the prediction errors at the preceding pixels. 
It can be optimized off line via linear regression for 
specific types of images. The conditioning classes for 
entropy coding are generated by quantizing the error energy 
estimator. The quantization can also be optimized via 
off-line dynamic programming to minimize the total code length 
of a set of training images. In addition, the CALIC system 
uses a novel and elegant technique to "sharpen" the 
conditional probabilities (thus reducing underlying entropy) 
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for entropy coding by a simple sign flipping laechanism 28 
without any increase in modeling space. 
ij^T^adient-Adnusted Predictor 

A nonlinear predictor according to the invention 
5 adapts itself to the image gradients near the predicted pixel. 
This predictor improves the robustness of traditional DPCM 
predictors, particularly in areas of edges. The basic 
function is now explained. 

Denote an input image of width W and height H by 

10 0^i<W, 0^j<B. In order not to obscure the 

concept of the proposed compression algorithm, we only 
consider in the following development the sequential coding of 
interior pixels Xti^j], 2 < i < Fi^-2, 2 < j < H-2 . Many 
possible treatments of boundary pixels are possible, and they 

15 do not make a significant difference in the final compression 
ratio due to the small population of boundary pixels. For 
instance, boundary pixels can be coded by a simple DPCM scheme 
as they are encountered in the raster scan. 

To facilitate the prediction of J[i,j] and entropy 

20 coding of the prediction error via context modeling, we 
compute the following quantities: 



25 



30 



|j[i+l,j-l] -X[i, j-1] I 

(2) 

= |J[i-l,j3 -Xti-l.J-l] h|r[i.j-l3 -X[i,j-2] h 
|j[i + l,j-ll -X[i-»-l, j-21 |. 



Clearly, and d^ are estimates, within a scaling 
factor, of the gradients of the intensity function near pixel 

in horizontal and vertical directions. The values of 
d^ and d^ are used to detect the magnitude and orientation of 
edges in the input image, and make necessary adjustments in 
the prediction. We aim to alleviate the problem that the 
precision of existing DPCM-type predictors can be adversely 
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affected by edges. In £guat:ions (2) t:hree absolute 
differences are used for d in each direction. This has been 
found to give the best compression results. Two or one 
absolute differences can be used here for lower complexity 
5 with a small loss in performance. Efficient incremental 
and/ or parallel schemes for evaluating and are 
straightforward. For instance, to avoid unnecessary repeated 
computations, one can store the values of | Jt • , • ] - J[ • , • | 
associated with preceding pixels for future reference. This 
10 only requires an array of the size W. 

For simple denotation in the sequel, we let 

" (3) 
meaning north, west, northeast, northwest, north-north, and 
west-west , respectively • 

The locations of these pixels with respect to J[i^j] 
are given in Fig. 2. 

20 Based on and d^, a simple technique, as described 

by the following conditional statements, is used to make a 
gradient-adjusted prediction (GAP) of J[i,j]. 
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IF (dv - dh > 80) {sharp horizontal edge} 
ELSE IF (d„ - dh < -80) {sharp vertical edge} 
5 ELSE { 

= (w+n)/2 + (ne-nw)/4; 
IF (dy - > 32) {horizontal edge} 

= J]+w)/2 
ELSE IF (dv - dh > 8) {weak horizontal edge} 
10 j[i/J] = (3^[i,J]+w)/4 

ELSE IF (d^ - dh < -3 2) {vertical edge} 

i[j-,3] = (-^[i,J]+n)/2 
ELSE IF (d^ - dh < -8) {weak vertical edge} 
ili.j] = (3/[i, j]+n) /4 

15 } 

The procedure given above is parallelizable . This 

technique differs from the existing linear predictors in that 

it weights the neighboring pixels of J[i,j] according to the 

estimated gradients of the image. In effect, is a 

20 simple, adaptive, nonlinear predictor. The predictor 

coefficients and thresholds given above were empirically 
chosen. A major criterion in choosing these coefficients is 
the ease of computations. For instance, most coefficients are 
of power of 2 to avoid multiplication and divisions. The 

25 multiples of 3 in the procedure above can be computed by a bit 
shift and an addition. 

It is possible, albeit quite expensive, to optimize 
the coefficients and thresholds for an image or a class of 
images, so that a norm of the expected prediction error 

30 - is minimized. It is not recommended that such an 

optimization process to be carried out on an image-by- image 
basis. However, it is important to point out that the 
coefficients and thresholds in computing can be set by 

the user, if the user knows the optimal or nearly optimal 

35 coefficients and thresholds for the target images. 
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Frror Energy Quantization for Minimum Entiropv 

Although the nonlinear predictor J[i,j] outperforms 
linear predictors, it does not completely remove the 
statistical redundancy in the image. The variance of 
prediction errors e = J - J strongly correlates to the 
smoothness of the image around the predicted pixel To 
model this correlation at a small computational cost, we 
define an error energy estimator to be 

A = ad^ + bd^ + cj e^i , (4) 



where and are defined in Equation (2) which are reused 
here to quantify the variability of pixel values, and 
e^^ = J[i-l,j] - J[i-l,j]. je^^l is chosen because large errors 
tend to occur consecutively. The coefficients a, b, and c can 
be determined, in an off-line design process, by the standard 
linear regression technique so that A is the least-squares 
estimator of the error strength |e| based on d^, d^, |e^|. 
For algorithm efficiency, we recommend a = b = i and c = 2 in 
Equation (4) • In our experiments we also find that other 
definitions of A can sometimes estimate the error energy 
better, such as 

^ = 3„in {<*h' Ci^} + b^ax ^ {iewl. i^nl}, (5) 

depending on images, where e^^ = J[i,j-l] - J[i,j-l]. 

By conditioning the error distribution on A, we can 
separate the prediction errors into classes of different 
variances. Thus entropy coding of errors using estimated 
conditional probability p(e|A) improves coding efficiency over 
using p(e) . For time and space efficiency, we quantize 
A to L levels. In practice, Ir=8 is found to be sufficient. 
Larger L improves coding efficiency only marginally. 
Denote the A quantizer by Q, i.e., Q(A) in {0,1, ,7}. In 
entropy coding of prediction errors, we estimate and use eight 
conditional probabilities p(e\Q(A) ) . Since A is a random 
variable, it requires only scalar quantization. The 



13 

errors. In an off-line design process, we get a training set: 
of (e,A) pairs from test images, and use the standard dynamic 
programming technique to choose 0 = <3o < ' < ^ ^ ^ 

to partition A into L intervals such that 



J} 53 p(e)logp(e) («) 



is minimized. 

In practice, ve found that an image- independent A 
quantizer whose bins are fixed, 

<3ri = 5, qr2 = 15, ^3 = 25, g^=A2, (75 = 60, q^^BS, q^^I^O. (7) 

10 

worked almost as well as the optimal image-dependent A 
quantizer. 

Estimating L^B conditional error probabilities 
p(e|(?(A)) requires only a modest amount of memory in the phase 
15 of entropy coding of prediction errors. Furthermore, the 

small number of involved conditional error probabilities means 
that even small images will provide enough samples for context 
modeling to learn p(e|(?(A)) quickly in adaptive entropy 
coding • 

20 

Context Mo deling of Prediction Errors 

The precision of the nonlinear GAP predictor 
can be significantly improved via context modeling, because 
gradients alone cannot adec^iately characterize some of the 
25 more complex relationships between the predicted pixel J[i/J] 
and its surrounding. Context modeling of the prediction error 
e = I - ^ can exploit higher-order structures such as texture 
patterns in the image for further compression gains. 

Denote by a IC-tuple C = {^o'^i ' "*'^K-l> ^ modeling 
30 context of J[i,j) that consists of K events x^. 

For both space and time efficiencies and to avoid 
the problem of context dilution, we need to drastically reduce 
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the nimber of possible contexts C by vector quantization of C. 
Specifically, we consider a prediction context of eight events 

in, w, nw, ne, nn, ww, 2n-nn, 2w-ww) 



5 and quantize context C = {Xq,x-^, -,x-,} to an 8-bit binary 
number b = b-jb^-bQ using the prediction value i as the 
threshold, namely 

jo i 
[l i/Xj, < 1 



Clearly, number (a binary vector codeword) encodes the 

10 texture patterns in the modeling context which are indicative 
of the behavior of e. Also note that an event in a 
prediction context need not be a neighboring pixel to 
It can be a function of some neighboring pixels. By letting 
Jfg = 2ii-nn, x-j = in the above, and consequently setting 

15 bg and b^ depending on whether 2n-ftn < J^[i,j] and 

2w^ww < we can detect whether the prediction value 

•^ti/J] forms a convex or concave waveform with respect to the 
neighboring pixels in vertical and horizontal directions, as 
depicted by Fig. 3. This convexity information is useful in 

20 the context modeling of e. 

Since the variability of neighboring pixels also 
influences the error distribution, we combine the quantized 
error energy 0 ^ l;?(A)/2j < L/2 with the quantized texture 
pattern O ^ S < 2*^ to form compound prediction contexts, 

25 denoted by C( /2j ,S) . This scheme can be viewed as a 

product quantization of two independently treated image 
features: spatial texture patterns and the energy of 
prediction errors. 

At a glance, we would seemingly use 4 • 2^ = 1024 

30 different compound contexts, since 0 i b?(A)/2j < L/2 = 4 and 
0 ^ B < 2^ = 2®. However, not all 2^ binary codewords of B 
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quantizer defined by (9) are possible. If the prediction 
value Jti,j] lies in between n and nn, then the condition 
2n-nn < is either always true or always false. In 

other words, the outcome of the test 2n-nn < J[i,j] in (9) is 
5 uniquely determined ±f n > and nn < or if 

n < i[x^j} and jin > This should be apparent from 

Fig. 3. By referring to (8) and (9), we see that in B, t>^ is 
fixed if Jb2 and are different. Likewise, by is fixed if bQ 
and Jb4 are different. Because Jb^, Jbj, and bg are not 

10 independent, they can only yield 2*2 + 2-1 = 6 combinations. 
The same holds for b-j, b^, and b^. Thus, B represents only 
5.6 • 4 = 144 rather than 256 valid textxire patterns. Finally, 
the total number of valid compound contexts in error modeling 
is only 4 • 144 = 576. 

15 Th model cost is still to high to estimate 

p(e|C( L(?{A) /2J ,B) ) for 576 compound contexts. Therefore, we 
estimate only the conditional expectations E{e|C(5,/S)} using 
the corresponding sample means e{S,P) for different compound 
contexts. Computing B(S,ff) involves only accumulating the 

20 error terms in each compound context and maintaining a count 
on the occurrence of each context. For each compound context 
C(S,0), 0 < 6 < A, 0 < 0 < 144, we count the number N(S,0) of 
occurrences of C{S,0) for the purpose of computing the 
conditional sample mean 1(6,0). We only use one byte to store 

25 the occurrence count. Whenever the count reaches some value 
^max ^ 256, we scale down the count but let the corresponding 
1(S,0) intact. We recommend = 128. 

In order to update 1(6,0) in error modeling, we use 
an accumulator S(6,0) of €(6,0), and compute 



30 



€(6,p) = S(5,p)/Ar(6,P) <10) 



whenever a compound context C(6,0) occurs. We use a 16-bit 
signed integer to store S(6,0) whose range is more than 
sufficient in practice. It takes more than 128 consecutive 
35 1(6,0) - -255 or 1(6,0) = 255 to violate the bounds 
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-2^5 < S(S,0) < 2^5, but we have « 128. Once N(S,0) 

reaches 128, we re-scale the variables by setting 

S(6,P) = 5(5,P)/2; = 64 (11) 



In summary, the coding system needs one byte for 
5 N{6,fi) and two bytes for S(S,0) for each of 576 compound 
contexts. Thus the total size of the memory required by 
context modeling of prediction errors can be as small as 1728 
bytes • 

Besides being a technique to reduce the memory use, 
10 rescaling also has the beneficial side effect of aging the 
observed data. This is an inexpensive way of adapting the 
context error modeling to time varying sources. Indeed, the 
scaling technique gave a slightly better compression in our 
experiments . 

15 

Context-based Adaptive Predict or via Error Feedback 

The idea of gaining coding efficiency by context 
modeling of expected errors E{e\C(S ,0) } came from the 
observation that the conditional mean e(5,/3) is generally not 

20 zero in a given context C(S,0). This does not contradict the 
well-known fact that the DPCM prediction error without 
conditioning on the contexts, follows a Laplacian (symmetric 
exponential) distribution, hence is zero mean for most 
continuous-tone images. The Laplacian distribution can be 

25 viewed as a composition of distributions of different means 
and different variances. Context modeling of prediction 
errors is a means to separate these distributions. Therefore, 
the more biased is e(S,fi) from zero, the more effective is the 
modeling. Since the conditional mean e{S,0) is the most 

30 likely prediction error in a given compound context C(5,/J) , we 
can improve the prediction by feeding back e{S,0) and 
adjusting the prediction J* to J = / + ^{6,0). 

In order not to over-adjust the GAP predictor, we 
actually consider the new prediction error c = J* - J rather 

35 than e = J - J* in context-based error modeling. The context 
modeling of € in turn leads to an improved predictor for 
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^' ^ ^ ^ ^^s^ff) where 1(6,0) is the sample mean of € 
conditioned on compound context C(S,0). 

Conceptually, we have a two-stage adaptive 
prediction scheme via context modeling of errors and error 
5 feedback. A blocX diagram of the scheme is given in Fig. 4. 

In the first stage, the encoder makes a GAP prediction ^ based 
on djj and d^. Then t is used as a threshold value to quantize 
a block of neighboring pixels into a spatial texture pattern B 
as in (9) . The encoder also computes the error energy 

10 estimator A, and quantizes it to 0(A). By a simple Cartesian 
product of 0(A) and B, a compound context 
C( Ip(A) /2j ,B) = C(S,0) is formed for context modeling of 
prediction errors. Algorithmically , C{S,&) just serves as an 
index to look up the most likely prediction error €(fi,/3) from 

15 a table of conditional sample means. In the second stage, 
1{S,0) is added to the first prediction i to arrive at an 
adaptive, context-based, non-linear prediction for 



Finally, the error e « Tti,j] - J[i/J] of the second 
20 prediction is entropy coded. Upon receiving e, the decoder 
can recover I"[i/jf] via the same adaptive context modeling 
scheme. After each pixel is encoded /decoded, both the encoder 
and decoder update l{S,fi) by the most recent observation 
e s X - jf in the current compound context C{S,0). 

25 

context Hierarchy and C ontext Selection 

Vfe call the context C defined by (8) the kernel 
context. It captures the most of the correlation between the 
prediction error and the surrounding pixels. However, the 
30 kernel context is generally not optimal in the sense of 
obtaining the minimum description length. The technique 
introduced in this section is for selecting optimal model 
contexts in a context hierarchy for gaining maximum 
compress ion . 

35 In his algorithm called Context Rissanen proposed a 

method of choosing optimal modeling contexts by assuming that 
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a one-dimensional data streaiQ like text is generated by a tree 
model. However, selecting optimal modeling contexts in 
universal lossless image compression is much more difficult 
than in universal text compression, because the image signal 
is not one-dimensional. In order to use the secfuential tree 
model on two-dimensional image data, one has to impose an 
order on the pixels in a modeling template. This order is 
required when traversing the tree for selecting the "optimal" 
context in which the next symbol is coded. However, as a 
modeling state, a context (causal template) is an integral 
entity, and should be treated as such. Any ordering of pixels 
in the causal template is artificial, and the modeling context 
selected based on this ordering may compromise the coding 
efficiency. 

To retain the cohesion and integrity of pixels in a 
modeling context, we generalize the nodes of the tree model to 
a two-dimensional causal template, and call the resulting tree 
model context hierarchy as depicted by Fig. 5. The root of 
the context hierarchy is the kernel context, denoted by Cq. 

Given a modeling context Cq that is a set of pixels, 
we call context an expansion of Cq if Cy^ z:) Cq. The set 
containment relation naturally defines a context hierarchy. 
The nodes of the context hierarchy correspond to nested 
modeling contexts. 

Although the conditional entropy with respect to the 
error probability density function p(e|C) is monotonically 
non-increasing in the size of causal template C, larger 
modeling context does not necessarily give more accurate 
estimate of e^^. Too large a causal template spreads samples 
too thin into too many contexts to obtain reliable estimates. 
Intuitively speaking, we want to choose a context as large as 
possible but provided that it occurred for a sufficient number 
of times in the past. In principle, Rissanen's algorithm 
Context can be generalized to the context hierarchy for 
selecting optimal context. Unfortunately, algorithm Context 
is impractical, and not suitable for hardware implementation 
or parallelization. As a practical alternative, we invented 
the following simple context selection method. 



wo 96/15620 ^ 0 PCr/CA95/00635 

19 

Refer to Fig. 5, we have Cq C C C3, and 
Co C C2 C C4, where Cq - {n,fcr,jiiir,ne,nn,ww,2n-n/i,2*r-*'w} is the 
Kernel context. For each context C^, 0 < i < 4, maintain the 
count Wi of the niomber of the times that has happened, and 
5 keep the sxim of the prediction errors under C^, as 

described in section 4.3. Then the optimal context selection 
and the corresponding context-based, adaptive, non- linear 
prediction can be efficiently done by the following simple 
logic: 

10 

Si = Sr = Sq; 

{IF} (W3 > T) 

{Si = S3; Ni = N3;} 
15 {ELSE IF} (Wi > T) 

{Si = Si,- Wi = Ni,-} 
{IF} (W4 > T) 

{Sr = = ''4»*> 

{ELSE IF} (N2 > T) 

20 iSr = Wr = ''z'*) 



25 



1 - I * — = — - ; 



The threshold t is normally set to 7. The value of 
T should be proportional to the variance of prediction errors. 

ffy.^TT>enina o f Conditional Error Probabilities 

30 As described in Section 4.2, we use the error energy 

quantizer to form eight conditional error probabilities 
p(€ 10(A)), 0 ^ 0(A) < 8, for entropy coding of c. Recall that 
the error energy quantizer Q is optimized in (6) to minimize 
the combined entropy of the eight conditional error 

35 probabilities. But p(£|0(A)) as is does not benefit from the 
error modeling based on the texture pattern B. For 
operational reasons, p(€|0(A)) rather than p(€ |C( LO(A) /2j , B) ) 
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are used in entropy coding of e, as the number of different 
compound contexts is too large. 

However, on a second reflection, the conditional 
sample means €(S,fi), which are dynaunically computed for error 
feedback, can **sharpen" the conditional probabilities 
p(€ 10(A)), or reduce their variances, as explained below, for 
free! We observed that under two different contexts C(S,ff^) 
and C(S,fi2^, two conditional sample means 1(6,02.) 7(6,02) 
could be significantly off from zero and have opposite signs, 
reflecting very different p(€\C(S,0^)) and p(€ \C(6 ,^2) ) • For 
a fixed 0 ^ 6 < B, one can then split the conditional 
probability p(€\Q(6) = 6) into two 



p+ (€ I «) = 



^ p(ei€ (6,p) ^0) 
(cje (6,P) iO) 



p- (c I 6 



^p(6|T(4,p) <0) 
^ ' (€|€(6,P) <o) 



(13) 



p+ being the conditional probability of the errors e in 
contexts C(S,0) such that 7(6,0) > 0, and p. being such that 
7(6,0) < 0. The two resulting conditional probabilities p+ 
and p. will have smaller variances than p(€\Q(6) = 6), making 
more distinctive error statistics available to the entropy 
coder. Seemingly, this splitting of conditional probabilities 
for entropy coding would double the memory use. But a very 
simple technicpie can reap almost the same compression gain 
achievable by (13) without increasing the use of physical 
memory . 

The conditional probability p(€\6) is the mixture of 
p+(€|5) and p_(c|tf). We observed in our experiments that 
p^(€\6) and p.(e\6) are approximately mirror image of each 
other around the origin. Therefore, we can flip p_(€|5) 
around the origin and superimpose it onto p^(e|5) to create a 
more biased conditional probability for entropy coding: 
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^(e|8) =p.(€|6) +p.(-€|») (14) 



as illustrated in Fig. 6. Clearly, p(c|*) has a lower entropy 
than p{€\S) , and it can be used by an entropy coder to reduce 
bit rates without any extra space. Suppose that the current 
5 context is C{6 . Before encoding € « J - f , the encoder 
checks whether 7(5,/?) < 0. If yes, -c, otherwise, c is 
encoded. Since the decoder also )cnows C(fi,/S) and 7(«,/3), it 
can reverse the sign, if necessary, to reconstruct €. 

This simple technique of sign flipping can reduce 

10 the bit rate by as much as three per cent on some test images. 
The improved coding efficiency is obtained, because the error 
modeling based on compound contexts C(6,/S) captures some of 
the statistical redundancy in the sign of e . In essence, by 
preserving or reversing the sign of c , we make a prediction on 

15 the sign of c . Thanks to context modeling the prediction is 
correct more than half of the time, yielding compression 
gains. 



20 The above adaptive, predictive coding scheme via 

context modeling of prediction errors is designed for 
compressing natural continuous-tone images. But the coder 
performance can be quite poor on images or subimages which 
contain very few grey levels, especially when compared with an 

25 algorithm based on explicit Markov modeling. The latter 

becomes feasible precisely because of the very small size of 
the symbol set. In this situation it is more effective to 
code pixel values directly rather than prediction errors. 

In order to effectively compress uniform or nearly 

30 uniform image areas, graphics, raster ized documents, and any 

combination of natural images with one or more of these types, 
according to the invention there is a binary coder as a 
separate module of the compression system, and means are 
provided to select between modes. The system operates in two 

35 modes: continuous-tone and binary. Before J[i,j] is to be 

coded, a tester is invoked to for proper mode. It checks six 
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neighboring pixels: ww, w, nw, ne , nn. If ^hese six pixels 
have no more than two different values, the binary mode is 
triggered; otherwise the system is caused to enter the 
continuous-tone mode in which the predictor J and the compound 
contexts C(S,ff) are in use. 

In the binary mode, let s^ = w and let the other 
value, if any, be S2$. The encoder describes J[i,j] in one of 
the three states, using a ternary code T: 



T = 



0 if J[i,j] = 

1 if J[i,j] = 

2 Otherwise 



(15) 



10 I" the escape case of r=2 , the encoder switches from 

the binary mode to the continuous-tone mode. This happens 
when the actual I[i,j] is found to violate the condition for 
binary mode. 

Similar to the continuous-tone mode, upon entering 
15 the binary mode, the system considers a context of six events 

c- (IC) 

\w,n,nw,ne,ww,arii. 



and quantize context C = {Xq,x^, , x^y to a 6-bit binary 
niunber B 



0 ijf JCj, = 

1 if jfj, = s. 



, 0 i ic < 6. 



(17) 



20 The binary number B represents a texture pattern around 

Il±,j'i. Note that because = b© = 0 can be ignored from 
the texture encoding B. Thus there are only 2^ = 32 different 
prediction contexts in the binary mode. Consequently, we use 
32 conditional probabilities p{T\B) to drive an adaptive 

25 arithmetic coder of three symbols. For the context modeling 
in the binary mode, only 32 x 3 = 96 frequency counts need to 
be maintained. 
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The incorporation of the binary mode into the 
compression system adds little to the system complexity, while 
greatly enhancing the coding performance on binary-type 
images, multimedia images, and images with large uniform 
areas. An important feature of our design is that the switch 
between continuous-tone and binary modes is context-dependent, 
automatic, and completely transparent to the user. 



vqTpiable Image Resolutions 

10 All parameters and thresholds of the predictors and 

the context quantizers are designed and optimized for images 
of 8 bit resolution, because this is the most popular 
intensity resolution. However, we devised a very simple 
scaling mechanism for the coding system to handle images of 

15 all resolutions with ease, with negligible penalty on 
compression performance. 

It is a design decision to scale and by some 
factor X, if necessary, in order to make the prediction module 
and context modeling module invariant to intensity 

20 resolutions. This is because it is far more involved to 
adjust parameters and thresholds in the prediction and 
modeling modules for the best compression performance for 
different intensity resolutions. 

Suppose that the input image has an intensity 

25 resolution of z bits, 1 < z £ 16. The simplest scaling factor 
for and is X = 2®"*. But in our experiments, we found 
that this simple scaling factor can incur quite heavy loss in 
coding efficiency if the input images are very smooth 
relatively to the dynamic intensity range. 

30 To solve this problem, it is preferred that d^ and 

fj^ be scaled according to the standard deviation a of the 
errors (the average of error magnitudes) in the previous row. 
Computationally, the value of a for the previous row is easy 
to update during the raster scan, requiring only an 

35 accumulator. Based on a, we use an empirical formula 
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A = 2 



"to compute scaling factor for and d^. 

No'te Uiat: t:he scaling recpiires only binary shifting. 

5 Progressive Transmission 

To achieve progressive transmission, the encoding, 
and accordingly the decoding, of an image is done in four 
passes as schematically described by Fig. 7. Each successive 
pass presents a better approximation of the original at a 

10 higher bit rate. The first pass obtains a compression ratio 

from 9:1 to 7:1 depending on images with an image quality that 
is comparable with lossy JPEG at the same compression ratio. 
The second pass presents a compressed image that is visually 
indistinguishable from the original at a compression ratio 

15 around 5:1. The third pass yields so-called functionally 

lossless compression at a compression ratio around 3:1. After 
the third pass, the errors are below such tight bounds in both 
magnitude and spatial distribution that their effects on most 
image processing and analysis functions are provably 

20 negligible. The fourth pass reaches true lossless compression 
by adding no more than 0.25 bits per pixel to the functionally 
lossless image from the third pass* The feature of 
progressive transmission is important for many applications 
such as remote query and retrieval in image databases, and in 

25 multiuse environment as described by US Patent 4,969,204 where 
different imaging devices of different resolutions access to 
the same image. 

Unlike sequential encoding schemes, the multipass 
encoding of an image can generate completely enclosing 

30 prediction contexts. 

Each of the four passes uses an interlaced sampling 
of the original image. Fig. 8 to Fig. 10 illustrate the 
patterns of the interlaced sampling from the first pass to the 
fourth pass respectively. Besides facilitating progressive 

35 transmission, the four-pass interlaced sampling scheme is also 
designed for the formation of modeling contexts that enclose 
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the predicted pixels in all directions. The spatial 
configurations of the resulting modeling contexts in 
individual passes are also depicted in Fig. 8 through Fig. 10. 
Many image feat\ires such as intensity gradients, edge 
5 orientations, textures can be better modeled by enclosing 

contexts as those in Fig. 9 and Fig. 10 than by the contexts 
that only partially enclose the unknown pixel as in one-pass 
sequential coding* 

The first pass encodes a subsampled Jf^/T, x H/2 image 
10 denoted by I^, with the following relation between J and 

I^U.D\ Jt2i.2j] ^JUi^l.2j^l] 0 ^ i < V/2. 0 ^ J < H/2. 

(19) 



Note that Ji[l^j] is no't the average intensity of a 2 x 2 
block but the average intensity of two diagonally-adjacent 
pixels. This subsampling is designed to benefit the 
context-based adaptive prediction in the subsequent passes. 
The F//2 X El 7. image is encoded in the conventional raster 
scan sequence by the sequential CALIC algorithm as described 
in previous sections. 

The second pass uses J^^ as the contexts to encode an 
F//2 X H/2 array of 2 -pixel blocks, called image Ij, where 

Jjli, j] = (J[2i,2j] , r[2i-H, 2j*l] ) , 0 i i < W/2, 0 i j < if/2 . 

(20) 



Note that JjCi^J] is a two-dimensional vector. 
Consequently, upon the completion of encoding 1^9 half of 
original W x H pixels will be reconstructed. Again, the image 
I2 is encoded in the conventional raster scan sequence. Since 

is by now available to both the encoder and decoder, it 
provides completely surrounding contexts for predicting and 
modeling J[2i,2j]. A possible context in this case is 
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C = {Jj , , , J[2i-1, 2j+l] ,X[2i-l, 2j-l] 

Xl2i + 1, 2J-1J , I[2i-2.2j] , Xl2i,2j-2j } 

(2X) 



See Fig. 9 for the spatial configuration of the context. 
Using the modeling contexts, the CALIC algorithm encodes the 
subsampled image X2- 

Once X[2i,2:f) is reconstructed, the decoder can set 

X[2i + l,2j*l] = 2Xi[i,j] -X[2i.2j] (22) 



without receiving any information on X[2i+1, 2j+l] . But a 

10 consultation with (19) reveals that (22) can cause a rounding 
error of 1 if the sum X[i^ j ]+X[2i+l, 2j+l] is an odd integer. 
The probability for this rounding error is 0.5. For the time 
being, this tiny, isolated error is tolerated. In Figs. 9 and 
10, the pixel with a probability 0.5 of being 1 smaller than 

15 the original value is marked by the unfilled circle. 

The third pass encodes the remaining half of the 
original W x H image X; namely, pixels interlaced in the 
checker board pattern, X[2i+l,2j) and X[2i,2j+1], 0 < i < W/2, 
0 ^ j < H/2. In the third pass, the image is also encoded in 

20 the conventional raster scan order. After the intermediate 

images X^ and I2 are coded, the modeling contexts available to 
the third pass are the most complete and relevant to the 
predicted pixels. Hence much more compression of the 
remaining half of the image can be achieved. Fig. 10 

25 illustrates the situation in the third pass and depicts a 

configuration of modeling context among many possibilities. 

After the third pass, the image is said to be 
functionally lossless for the following reasons: 

30 • The error magnitude is bounded by 1. 
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The errors are spatially isolated. The errors can 
only occur at the positions marked by unfilled 
circles in Fig. 4. No consecutive errors can 
happen. 

At the already isolated potential error positions, 
the errors are distributed randomly. 

The errors have no effect on the average intensity 
in a window of any size. 



15 • The errors cannot alter the sign of the gradients of 

the original image function at any position or in 
any direction. 



The effects of the errors on the filtering 
operations on the original image will be either nil 
or negligibly small. Given a filter kernel, the 
worst error impact on the filtering operation can be 
precisely computed to be a known prior. 
If true lossless reconstruction is indeed required, 
the rounding errors of (22) can be corrected by one more pass. 

Progressive, multiresolution decompression is a 
natural product of the above four-pass encoding scheme. By 
choosing I^, and then functionally lossless I or true 
lossless J, the decoder obtains a reconstruction at a desired 
resolution and bit rate. 

Rntropv e nding of Prediction Errors 

An advantage of this invention is the clean 
separation between context-based prediction and modeling of 
image data and entropy coding of prediction errors. Any 
entropy coder, be it Huffman or arithmetic, static or 
adaptive, binary or m-ary, can be easily interfaced with the 
CALIC system. The system should be made flexible enough to 
accommodate all entropy coding methods that are known to date. 
If system complexity and cost are of primary concern, static 
global Huffman coders can be used. On the other hand, for 



20 



25 
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best compression possible, adaptive arithmetic coders will be 
tbe choice. 

p^eompiression 

5 The decompression or decoding process of the CALIC 

system is a straightforward reverse of the encoding process 
whose details were just explained. The decoding process 
reconstructs the original image in the same order as the image 
was encoded by the CALIC system. The decoding system selects 

10 either sequential or progressive decompression, depending on 

whether the image is compressed sequentially or progressively. 
Referring to Fig. 1, the CALIC decoding process automatically 
enters one of the binary or continuous^tone decompression 
modes, based on the exactly same context-sensitive decision 

15 that is made by the encoder. Thus the encoder and decoder can 
synchronize with each other without using any side 
information • 

In the binary mode, a context-based adaptive entropy 
coder that is identical to the one used in' the encoding 

20 process is used to decode the current symbol. 

In the continuous -tone mode, the gradient-adjusted 
prediction, denoted J, of J is made exactly in the same manner 
as the encoder, and the predictor i is further improved by the 
same context-sensitive error feedback technique that is used 

25 in the encoding process. Since predictions for the current 
pixel that are made by the encoder are based solely on the 
pixels that have already been encoded, the decoder can perform 
the same predictions, context formation, context selection, 
context quantization, error feedback and entropy coding 

30 context determination. The decoder can then uniquely decode 

the prediction error from the compressed bit stream and add it 
to the prediction in order to reconstruct the exact original 
value of the current pixel. The decoder proceeds in this 
manner and recovers the original image pixel by pixel from the 

35 prediction errors that it decodes one at a time from the 
compressed bit stream. 

The invention has now been explained with reference 
to specific embodiments. Other embodiments will be apparent 
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to those of ordinary skill in the art. Therefore, it is not 
intended that this invention be limited, except as indicated 
by the appended claims. 
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WHAT TS CLAIMED IS: 

1 1. A me'thod for lossless image data compression 

2 comprising the steps of : 

3 dynamically and automatically choosing between a 

4 binary level compression mode and a continuous-tone level 

5 compression mode for each current image element based on local 

6 context of said current image element; thereafter 

7 compressing binary image data of said current image 

8 element, in said binary mode, by context-based, adaptive, 

9 ternary entropy encoding and storing first results in a memory 

10 as a first compressed portion of the image data; 

11 compressing continuous-tone level image data of said 

12 current image element, in said continuous-tone mode, by 

13 con text- based, adaptive, non-linear predictive entropy 

14 encoding and storing second results in said memory as a second 

15 compressed portion of the image data; 

16 wherein said binary mode entropy encoding is a first 

17 selected context-sensitive entropy— encoding process; and 

18 wherein said continuous -tone mode entropy encoding 

19 is a second selected context-sensitive entropy-encoding 

20 process wherein prediction error is entropy encoded. 

1 2. The method according to claim 1 wherein first 

2 selected specific compression techniques are used for 

3 sequential transmission of said first compressed portion and 

4 said second compressed portion of the image data. 
5 

6 3. The method according to claim 1 wherein second 

7 selected specific compression techniques are used for 

8 progressive transmission of said first compressed portion and 

9 said second compressed portion of the image data. 

1 4. The method according to claim 3 further 

2 comprising subsampling images in four passes; and 

3 forming from subsampling data enclosing contexts in 

4 the form of causal templates. 
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3^ 5. The method according to claim 1 wherein said 

2 current image element is a pixel, and wherein in said 

3 continuous- tone mode compressing step comprises predicting 

4 values for each said pixel based on local intensity gradient 

5 estimates • 

^ 6. The method according to claim 5 wherein said 

2 predicting step further includes estimating energy of 

3 prediction errors based on both local gradient and prediction 

4 errors of preceding pixels together to obtain an error energy 

5 estimator. 

2 7. The method according to claim 5 wherein said 

2 continuous-tone mode entropy encoding further includes 

3 estimating energy of prediction errors based on both local 

4 gradient and prediction errors of preceding pixels together. 

1 8. The method according to claim 7 further 

2 including reversing sign of a prediction error to sharpen the 

3 conditional error probability densities for entropy coding. 

1 9. The method according to claim 7 further 

2 including adaptive bit shifting in each encoding context in 

3 order to scale d^, and d^, where and d^ are estimates, 

4 within a scaling factor, of gradients of the intensity 

5 function near pixel ICi,j) in horizontal and vertical 

6 directions, such that encoding schemes are independent of 

7 intensity resolutions. 

3^ 10. The method according to claim 6 further 

2 including quantizing the error energy estimator to form 

3 conditioning classes for entropy encoding in the continuous- 

4 tone mode. 



1 
2 



11. The method according to claim 5, further 
including forming modeling contexts by causal templates using 



3 a prediction value of a pixel. 
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1 12. The method according to claim 11, wherein said 

2 quantizing of the modeling contexts comprises binarization of 

3 spatial textiire patterns. 

1 13. The method according to claim 5, further 

2 including selecting an optimal modeling context in a context 

3 hierarchy. 

1 14. The method according to claim 5 further 

2 including conjoining a (quantized texture pattern and a 

3 quantized error energy estimator into a compound context for 

4 modeling prediction errors. 

1 15. The method according to claim 5 further 

2 including using conditional expectations of the prediction 

3 errors to model errors at low model cost and low computational 

4 cost. 

1 16. The method according to claim 5 further 

2 including reducing weight of past statistics in adapting to 

3 non-stationary image data. 

1 17. The method according to claim 5 further 

2 including correcting prediction via context modeling of 

3 prediction errors and error feedback. 

1 18. The method according to claim 1 wherein said 

2 choosing step comprises selecting between said binary level 

3 compression mode and said continuous-tone level compression 

4 mode based on local context information only and without use 

5 of side information. 

1 19. The method according to claim l wherein said 

2 binary mode compressing step comprises forming a modeling 

3 context for adaptive binary entropy encoding. 

1 20. A method for lossless image data compression 

2 comprising the steps of: 
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dynamically and automatically choosing between a 
binary level compression mode and a continuous-tone level 
compression mode for each current image element based on local 

6 context of said current image element, said current image 

7 element being a pixel; thereafter, 

8 compressing binary image data of said current image 

9 element, in said binary mode, by context-based, adaptive, 

10 ternary entropy encoding and storing first results in a memory 

H as a first compressed portion of the image data; 

3^2 compressing continuous-tone level image data of said 

13 current image element, in said continuous-tone mode, by 

14 context-based, adaptive, non-linear predictive entropy 

15 encoding and storing second results in said memory as a second 

16 compressed portion of the image data; 

wherein said binary mode entropy encoding is a first 

18 selected context-sensitive entropy-encoding process; and 
3^9 wherein said continuous-tone mode entropy encoding 

20 is a second selected context-sensitive entropy-encoding 

21 process wherein prediction error is entropy encoded; 

22 wherein said continuous -tone mode compressing step 

23 further includes: 

24 predicting values for each said pixel based on local 

25 intensity gradient estimates, including estimating energy 

26 of prediction errors based on both local gradient and 

27 prediction errors of preceding pixels together to obtain 

28 an error energy estimator; 

29 forming modeling contexts by causal templates using 

30 a prediction value of a pixel; 

2x selecting an optimal modeling context in a context 

32 hierarchy; 

33 combining a quantized texture pattern and a 

34 quantized error energy estimator into a compound context 

35 for modeling prediction errors; 

35 using conditional expectations of the prediction 

37 errors to model errors at low model cost and 

35 computational cost; 

39 correcting prediction via context modeling of 

40 prediction errors and error feedback; and 
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wherein said con*tinuous-tone mode entropy encoding 
further includes: 

estimating energy of prediction errors based on both 
local gradient and prediction errors of preceding pixels 
together ; 

quantizing the error energy estimator to form 
conditioning classes for entropy encoding in the 
continuous -tone mode; and 

reversing sign of a prediction error to sharpen the 
conditional error probability densities for entropy 
encoding • 



21. A system for lossless image data compression 
comprising: 

a first subsystem for dynamically and automatically 
choosing between a binary level compression mode and a 
continuous- tone level compression mode for each current image 
element of an input image based on local context of said 
current image element, including a values predictor operative 
on each said image element wherein prediction is based on 
local intensity gradient estimates; 

a second subsystem for compressing, in said binary 
mode, the image data of said current image element by 
context-based, adaptive, ternary entropy encoding as a first 
compressed portion of the image data; and 

a third subsystem for compressing, in said 
continuous-tone mode, the image data of said current image 
element by context -based , adaptive, non-linear predictive 
entropy encoding as entropy-encoded prediction errors of a 
second portion of the image. 

22 . A method for lossless image data decompression 
comprising the steps of: 

dynamically and automatically choosing between image 
data compressed by a binary level compression and image data 
compressed by continuous-tone level compression for each 
current image element based on local context of said current 
image element; thereafter either 
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3 decompressing, in said binary mode, the image data 

9 of said current image element by context-based, adaptive, 

10 ternary entropy decoding to produce a first decompressed 

11 portion of the image data; and 

^2 decompressing, in said continuous-tone mode, the 

13 image data of said current image element by context-based, 

14 adaptive, non-linear prcedictive entropy decoding as a second 

15 decompressed portion of the image; and 

directing the first decompressed portion and the 

17 second decompressed portion to an output utilization device to 

18 produce a binary level and continuous-tone level composite 

19 image. 

1 23. A method for functionally lossless image data 

2 compression comprising the steps of: 

3 dynamically and automatically choosing between a 

4 binary level compression mode and a continuous -tone level 

5 compression mode for each current image element based on local 

6 context of said current image element; thereafter 

7 compressing binary image data of said current image 

8 element, in said binary mode, by functionally-lossless 

9 context-based, adaptive, ternary entropy encoding and storing 

10 first results in a memory as a first compressed portion of the 

11 image data, such that errors in a decompressed version of said 

12 image data do not exceed 1 and never occur consecutively in 

13 image space; 

14 compressing continuous-tone level image data of said 

15 current image element, in said continuous-tone mode, by 

16 functionally- lossless context-based, adaptive, non-linear 

17 predictive entropy encoding and storing second results in said 

18 memory as a second compressed portion of the image data, such 

19 that errors in a decompressed version of said image data do 
not exceed 1 and never occur consecutively in image space; 

wherein said binary mode entropy encoding is a first 

22 selected context-sensitive entropy-encoding process; and 

23 wherein said continuous-tone mode entropy encoding 

24 is a second selected context-sensitive entropy-encoding 

25 process wherein prediction error is entropy encoded. 



20 
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